VCTR/Mean_8h_source.html

/*

  ==============================================================================

    DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.


    Copyright 2023 by sonible GmbH.


    This file is part of VCTR - Versatile Container Templates Reconceptualized.


    VCTR is free software: you can redistribute it and/or modify

    it under the terms of the GNU Lesser General Public License version 3

    only, as published by the Free Software Foundation.


    VCTR is distributed in the hope that it will be useful,

    but WITHOUT ANY WARRANTY; without even the implied warranty of

    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the

    GNU Lesser General Public License version 3 for more details.


    You should have received a copy of the GNU Lesser General Public License

    version 3 along with VCTR.  If not, see <https://www.gnu.org/licenses/>.

  ==============================================================================

*/


namespace vctr::expressions

{


template <size_t extent, class SrcType>

requires is::number<ValueType<SrcType>>

class Mean : public ExpressionTemplateBase

{

public:

    using value_type = ValueType<SrcType>;


    VCTR_COMMON_UNARY_EXPRESSION_MEMBERS (Mean, src)


    static constexpr value_type reductionResultInitValue = 0;


    VCTR_FORCEDINLINE constexpr void reduceElementWise (value_type& result, size_t i) const

    {

        result += src[i];

    }


    //==============================================================================

    VCTR_FORCEDINLINE value_type reduceVectorOp() const

    requires is::suitableForAccelerateRealFloatVectorReductionOp<SrcType, value_type, detail::dontPreferIfIppAndAccelerateAreAvailable>

    {

        return Expression::Accelerate::mean (src.data(), size());

    };


    VCTR_FORCEDINLINE value_type reduceVectorOp() const

    requires is::suitableForIppRealOrComplexFloatVectorReductionOp<SrcType, value_type, detail::preferIfIppAndAccelerateAreAvailable>

    {

        return Expression::IPP::mean (src.data(), sizeToInt (size()));

    };


    //==============================================================================

    VCTR_FORCEDINLINE void reduceNeonRegisterWise (NeonRegister<value_type>& result, size_t i) const

    requires Config::archARM && has::getNeon<SrcType> && (is::realFloatNumber<value_type> || is::int32Number<value_type>)

    {

        result = Expression::Neon::add (result, src.getNeon (i));

    }


    VCTR_FORCEDINLINE VCTR_TARGET ("avx") void reduceAVXRegisterWise (AVXRegister<value_type>& result, size_t i) const

    requires Config::archX64 && has::getAVX<SrcType> && is::realFloatNumber<value_type>

    {

        result = Expression::AVX::add (result, src.getAVX (i));

    }


    VCTR_FORCEDINLINE VCTR_TARGET ("avx2") void reduceAVXRegisterWise (AVXRegister<value_type>& result, size_t i) const

    requires Config::archX64 && has::getAVX<SrcType> && is::int32Number<value_type>

    {

        result = Expression::AVX::add (result, src.getAVX (i));

    }


    VCTR_FORCEDINLINE VCTR_TARGET ("sse4.1") void reduceSSERegisterWise (SSERegister<value_type>& result, size_t i) const

    requires Config::archX64 && has::getSSE<SrcType> && (is::realFloatNumber<value_type> || is::int32Number<value_type>)

    {

        result = Expression::SSE::add (result, src.getSSE (i));

    }


    //==============================================================================

    template <size_t n>

    VCTR_FORCEDINLINE constexpr value_type finalizeReduction (const std::array<value_type, n>& sums) const

    {

        auto sum = n == 1 ? sums[0] : std::reduce (sums.begin(), sums.end());


        return value_type (sum / FloatType<RealType<value_type>> (src.size()));

    }

};


template <size_t extent, class SrcType>

requires is::number<ValueType<SrcType>>

class MeanSquare : public ExpressionTemplateBase

{

public:

    using value_type = ValueType<SrcType>;


    VCTR_COMMON_UNARY_EXPRESSION_MEMBERS (MeanSquare, src)


    static constexpr value_type reductionResultInitValue = 0;


    VCTR_FORCEDINLINE constexpr void reduceElementWise (value_type& result, size_t i) const

    {

        auto s = src[i];

        result += s * s;

    }


    //==============================================================================

    VCTR_FORCEDINLINE value_type reduceVectorOp() const

    requires is::suitableForAccelerateRealFloatVectorReductionOp<SrcType, value_type, detail::preferIfIppAndAccelerateAreAvailable>

    {

        return Expression::Accelerate::meanSquare (src.data(), size());

    };


    VCTR_FORCEDINLINE value_type reduceVectorOp() const

    requires is::suitableForIppRealFloatVectorReductionOp<SrcType, value_type, detail::dontPreferIfIppAndAccelerateAreAvailable>

    {

        auto l2Norm = Expression::IPP::l2Norm (src.data(), sizeToInt (size()));

        return (l2Norm * l2Norm) / value_type (size());

    };


    //==============================================================================

    VCTR_FORCEDINLINE void reduceNeonRegisterWise (NeonRegister<value_type>& result, size_t i) const

    requires Config::archARM && has::getNeon<SrcType> && (is::realFloatNumber<value_type> || is::int32Number<value_type>)

    {

        auto s = src.getNeon (i);

        s = Expression::Neon::mul (s, s);

        result = Expression::Neon::add (result, s);

    }


    VCTR_FORCEDINLINE VCTR_TARGET ("avx") void reduceAVXRegisterWise (AVXRegister<value_type>& result, size_t i) const

    requires Config::archX64 && has::getAVX<SrcType> && is::realFloatNumber<value_type>

    {

        auto s = src.getAVX (i);

        s = Expression::AVX::mul (s, s);

        result = Expression::AVX::add (result, s);

    }


    VCTR_FORCEDINLINE VCTR_TARGET ("sse4.1") void reduceSSERegisterWise (SSERegister<value_type>& result, size_t i) const

    requires Config::archX64 && has::getSSE<SrcType> && is::realFloatNumber<value_type>

    {

        auto s = src.getSSE (i);

        s = Expression::SSE::mul (s, s);

        result = Expression::SSE::add (result, s);

    }


    //==============================================================================

    template <size_t n>

    VCTR_FORCEDINLINE constexpr value_type finalizeReduction (const std::array<value_type, n>& sums) const

    {

        auto sum = n == 1 ? sums[0] : std::reduce (sums.begin(), sums.end());


        return value_type (sum / FloatType<RealType<value_type>> (size()));

    }

};


template <size_t extent, class SrcType>

requires is::realOrComplexFloatNumber<ValueType<SrcType>>

class RootMeanSquare : public ExpressionTemplateBase

{

public:

    using value_type = ValueType<SrcType>;


    VCTR_COMMON_UNARY_EXPRESSION_MEMBERS (RootMeanSquare, src)


    static constexpr value_type reductionResultInitValue = 0;


    VCTR_FORCEDINLINE constexpr void reduceElementWise (value_type& result, size_t i) const

    {

        auto s = src[i];

        result += s * s;

    }


    //==============================================================================

    VCTR_FORCEDINLINE value_type reduceVectorOp() const

    requires is::suitableForAccelerateRealFloatVectorReductionOp<SrcType, value_type, detail::preferIfIppAndAccelerateAreAvailable>

    {

        return Expression::Accelerate::rms (src.data(), size());

    };


    VCTR_FORCEDINLINE value_type reduceVectorOp() const

    requires is::suitableForIppRealFloatVectorReductionOp<SrcType, value_type, detail::dontPreferIfIppAndAccelerateAreAvailable>

    {

        auto l2Norm = Expression::IPP::l2Norm (src.data(), sizeToInt (size()));

        return std::sqrt ((l2Norm * l2Norm) / value_type (size()));

    };


    //==============================================================================

    VCTR_FORCEDINLINE void reduceNeonRegisterWise (NeonRegister<value_type>& result, size_t i) const

    requires Config::archARM && has::getNeon<SrcType> && (is::realFloatNumber<value_type> || is::int32Number<value_type>)

    {

        auto s = src.getNeon (i);

        s = Expression::Neon::mul (s, s);

        result = Expression::Neon::add (result, s);

    }


    VCTR_FORCEDINLINE VCTR_TARGET ("avx") void reduceAVXRegisterWise (AVXRegister<value_type>& result, size_t i) const

    requires Config::archX64 && has::getAVX<SrcType> && is::realFloatNumber<value_type>

    {

        auto s = src.getAVX (i);

        s = Expression::AVX::mul (s, s);

        result = Expression::AVX::add (result, s);

    }


    VCTR_FORCEDINLINE VCTR_TARGET ("sse4.1") void reduceSSERegisterWise (SSERegister<value_type>& result, size_t i) const

    requires Config::archX64 && has::getSSE<SrcType> && is::realFloatNumber<value_type>

    {

        auto s = src.getSSE (i);

        s = Expression::SSE::mul (s, s);

        result = Expression::SSE::add (result, s);

    }


    //==============================================================================

    template <size_t n>

    VCTR_FORCEDINLINE constexpr value_type finalizeReduction (const std::array<value_type, n>& squaredSums) const

    {

        auto squaredSum = n == 1 ? squaredSums[0] : std::reduce (squaredSums.begin(), squaredSums.end());

        auto meanSquaredSum = squaredSum / RealType<value_type> (src.size());


    #if VCTR_USE_GCEM

        if constexpr (is::realFloatNumber<value_type>)

        {

            if (std::is_constant_evaluated())

            {

                return value_type (gcem::sqrt (meanSquaredSum));

            }

        }

    #endif


        return value_type (std::sqrt (meanSquaredSum));

    }

};


} // namespace vctr::expressions


namespace vctr

{


constexpr inline ExpressionChainBuilder<expressions::Mean> mean;


constexpr inline ExpressionChainBuilder<expressions::MeanSquare> meanSquare;


constexpr inline ExpressionChainBuilder<expressions::RootMeanSquare> rms;


} // namespace vctr

vctr::expressions::MeanSquare
Definition: Mean.h:93

vctr::expressions::Mean
Definition: Mean.h:29

vctr::expressions::RootMeanSquare
Definition: Mean.h:159

vctr::has::getAVX
Constrains a type to have a member function getAVX (size_t) const.
Definition: ContainerAndExpressionConcepts.h:78

vctr::has::getNeon
Constrains a type to have a member function getNeon (size_t) const.
Definition: ContainerAndExpressionConcepts.h:74

vctr::has::getSSE
Constrains a type to have a member function getSSE (size_t) const.
Definition: ContainerAndExpressionConcepts.h:82

vctr::is::int32Number
Constrains a type to represent a real valued 32 bit integer number.
Definition: NumericTypeConcepts.h:53

vctr::is::number
Constrains a type to represent a real valued or std::complex number type.
Definition: NumericTypeConcepts.h:45

vctr::is::realFloatNumber
Constrains a type to represent a real valued floating point number.
Definition: NumericTypeConcepts.h:79

vctr::is::realOrComplexFloatNumber
Constrains a type to represent a real or complex valued floating point number.
Definition: NumericTypeConcepts.h:87

vctr::is::suitableForAccelerateRealFloatVectorReductionOp
A combined concept to check if Apple Accelerate is a suitable option for a floating point vector redu...
Definition: ContainerAndExpressionConcepts.h:262

vctr::is::suitableForIppRealFloatVectorReductionOp
A combined concept to check if Intel IPP is a suitable option for a floating point vector reduction o...
Definition: ContainerAndExpressionConcepts.h:286

vctr::is::suitableForIppRealOrComplexFloatVectorReductionOp
A combined concept to check if Intel IPP is a suitable option for a real or complex floating point ve...
Definition: ContainerAndExpressionConcepts.h:290

vctr::rms
constexpr ExpressionChainBuilder< expressions::RootMeanSquare > rms
Computes the square root of the mean value of the squared source values.
Definition: Mean.h:254

vctr::mean
constexpr ExpressionChainBuilder< expressions::Mean > mean
Computes the mean value of the source values.
Definition: Mean.h:242

vctr::sum
constexpr ExpressionChainBuilder< expressions::Sum > sum
Computes the sum of the source values.
Definition: Sum.h:116

vctr::meanSquare
constexpr ExpressionChainBuilder< expressions::MeanSquare > meanSquare
Computes the mean value of the squared source values.
Definition: Mean.h:248

vctr
The main namespace of the VCTR project.
Definition: Array.h:24

vctr::ValueType
typename detail::ValueType< std::remove_cvref_t< T > >::Type ValueType
If T is an expression template, it equals its return type, if it's a type that defines value_type as ...
Definition: Traits.h:201

vctr::FloatType
typename detail::FloatType< std::remove_cvref_t< T > >::Type FloatType
The best matching float type for the real number type T.
Definition: Traits.h:219

vctr::RealType
typename detail::RealType< std::remove_cvref_t< T > >::Type RealType
If T is any instance of std::complex, this will be the real value_type, otherwise this will be T.
Definition: Traits.h:211

vctr::sizeToInt
int sizeToInt(size_t size)
Casts the size_t argument to an int.
Definition: PlatformVectorOpsHelpers.h:27

vctr::AVXRegister
Definition: AVXRegister.h:28

vctr::ExpressionChainBuilderWithRuntimeArgs
An expression chain builder is an object which supplies various operator<< overloads which build chai...
Definition: ExpressionChainBuilder.h:136

vctr::ExpressionTemplateBase
The base class to every expression template.
Definition: ExpressionTemplate.h:37

vctr::NeonRegister
Definition: NeonRegister.h:28

vctr::SSERegister
Definition: SSERegister.h:28