plain/latest/_workload_data_8cpp_source.html

//

// Copyright © 2017-2024 Arm Ltd and Contributors. All rights reserved.

// SPDX-License-Identifier: MIT

//


#include <armnn/backends/TensorHandle.hpp>

#include <armnn/backends/WorkloadData.hpp>

#include <armnn/backends/WorkloadInfo.hpp>

#include <armnnUtils/DataLayoutIndexed.hpp>

#include <armnnUtils/TensorUtils.hpp>

#include <armnnUtils/Permute.hpp>

#include <armnn/utility/NumericCast.hpp>

#include <armnn/Logging.hpp>


#include <algorithm>

#include <iomanip>

#include <string>

#include <sstream>


#include <fmt/format.h>


using namespace armnnUtils;


namespace armnn

{


//---------------------------------------------------------------

DataType GetBiasDataType(DataType inputDataType)

{

    switch (inputDataType)

    {

        case DataType::Float16:

            return DataType::Float16;

        case DataType::BFloat16:

        case DataType::Float32:

            return DataType::Float32;

        case DataType::QAsymmS8:

        case DataType::QAsymmU8:

        case DataType::QSymmS8:

        case DataType::QSymmS16:

            return DataType::Signed32;

        default:

            throw InvalidArgumentException("GetBiasDataType(): Unsupported data type.");

    }

}


namespace

{


//---------------------------------------------------------------

//android ndk does not support std::to_string function.

template <typename T>

std::string to_string(T value)

{

    std::ostringstream os;

    os << value;

    return os.str();

}


//---------------------------------------------------------------

void ValidatePointer(const void* ptr, std::string const& descName, std::string const& paramName)

{

    if (!ptr)

    {

        throw InvalidArgumentException(descName +  ": Invalid null pointer. The " +

                                      paramName + " parameter must be set.");

    }

}


//---------------------------------------------------------------

void ValidateTensorShapesMatch(const TensorInfo& first,

                               const TensorInfo& second,

                               std::string const& descName,

                               std::string const& firstName,

                               std::string const& secondName)

{

    if (first.GetShape() != second.GetShape())

    {

        throw InvalidArgumentException(descName + ": "

                                       + firstName + " & " + secondName + " must have identical shapes");

    }

}


//---------------------------------------------------------------

void ValidateNumInputs(const WorkloadInfo& workloadInfo, std::string const& descName, const unsigned int expectedSize)

{

    if (workloadInfo.m_InputTensorInfos.size() != expectedSize)

    {

        throw InvalidArgumentException(descName +

                                       ": Requires exactly " + to_string(expectedSize) + "input(s). " +

                                       to_string(workloadInfo.m_InputTensorInfos.size()) + " have been provided.");

    }

}


//---------------------------------------------------------------

void ValidateNumOutputs(const WorkloadInfo& workloadInfo, std::string const& descName, const unsigned int expectedSize)

{

    if (workloadInfo.m_OutputTensorInfos.size() != expectedSize)

    {

        throw InvalidArgumentException(descName +

                                       ": Requires exactly " + to_string(expectedSize) + " output(s). " +

                                       to_string(workloadInfo.m_OutputTensorInfos.size()) + " has been provided.");

    }

}


//---------------------------------------------------------------


//---------------------------------------------------------------

void ValidateTensorNumElements(const TensorInfo& tensor,

                               std::string const& descName,

                               unsigned int numElements,

                               std::string const& tensorName)

{

    if (tensor.GetNumElements() != numElements)

    {

        throw InvalidArgumentException(descName + ": Expected " + to_string(numElements) + " but got " +

                                       to_string(tensor.GetNumElements()) + " elements for " +

                                       tensorName + " tensor.");

    }

}


//---------------------------------------------------------------

void ValidateTensorDataType(const TensorInfo& tensor, DataType dataType,

    const std::string& descName, std::string const& tensorName)

{

    if (tensor.GetDataType() != dataType)

    {

        throw InvalidArgumentException(descName + ": Expected data type " + GetDataTypeName(dataType) + " but got " +

            GetDataTypeName(tensor.GetDataType()) + " for " + tensorName + " tensor.");

    }

}


void ValidPerAxisQuantizedDataType(const TensorInfo& tensor, const std::string& descName, const std::string& tensorName)

{

    if (tensor.GetDataType() != DataType::QSymmS8)

    {

        throw InvalidArgumentException(descName +

            ": Expected data type which supports per-axis quantization scheme but got " +

            GetDataTypeName(tensor.GetDataType()) + " for " + tensorName + " tensor.");

    }

}


//---------------------------------------------------------------

void ValidateTensorQuantizationSpace(const TensorInfo& first,

                                     const TensorInfo& second,

                                     const std::string& descName,

                                     std::string const& firstName,

                                     std::string const& secondName)

{

    if (!first.IsQuantized() ||

        !second.IsQuantized())

    {

        // Not a quantized type, ignore the validation

        return;

    }


    DataType firstDataType  = first.GetDataType();

    DataType secondDataType = second.GetDataType();


    if (firstDataType != secondDataType)

    {

        throw InvalidArgumentException(descName + ": " + firstName + " and " + secondName +

                                       " must be of the same quantized type, " +

                                       firstName + " is " + GetDataTypeName(firstDataType) + ", " +

                                       secondName + " is " + GetDataTypeName(secondDataType));

    }


    if (!first.IsTypeSpaceMatch(second))

    {

        throw InvalidArgumentException(descName + ": " + firstName + " and " + secondName +

                                       " must have the same quantization space, " +

                                       firstName + " has offset " + to_string(first.GetQuantizationOffset()) +

                                       " and scale " + to_string(first.GetQuantizationScale()) + ", " +

                                       secondName + " has offset " + to_string(second.GetQuantizationOffset()) +

                                       " and scale " + to_string(second.GetQuantizationScale()));

    }

}


//---------------------------------------------------------------

void ValidateBiasTensorQuantization(const TensorInfo& biasTensor,

                                    const TensorInfo& weightsTensorInfo,

                                    const std::string& descName)

{

    if (biasTensor.GetQuantizationOffset() != 0)

    {

        throw InvalidArgumentException(descName + ": Expected zero quantization offset for bias tensor but got " +

            to_string(biasTensor.GetQuantizationOffset()));

    }


    if (biasTensor.HasMultipleQuantizationScales() || weightsTensorInfo.HasMultipleQuantizationScales())

    {

        // Validate per-axis quantization scales

        const std::vector<float>& weightScales = weightsTensorInfo.GetQuantizationScales();

        const std::vector<float>& biasScales   = biasTensor.GetQuantizationScales();


        if (weightScales.size() != biasScales.size())

        {

            std::stringstream msg;

            msg << descName << ": Expected matching number of per-axis quantization scales for weights and bias, "

                << "but got different values. This is currently unsupported: weights=" << weightScales.size()

                << ", biases=" << biasScales.size();

            throw InvalidArgumentException(msg.str(), CHECK_LOCATION());

        }

    }

}


//---------------------------------------------------------------

void ValidateTensors(const std::vector<ITensorHandle*>& vec,

                     unsigned int numExpected,

                     const std::string& descName,

                     const std::string& varName)

{

    if (vec.empty() && numExpected > 0)

    {

        throw InvalidArgumentException(descName + ": Invalid empty " + varName + " array.");

    }


    for (unsigned int i = 0; i < numExpected; ++i)

    {

        if (!vec[i])

        {

            throw InvalidArgumentException(descName + ": Invalid NULL for " + varName + to_string(i));

        }

    }

}


//---------------------------------------------------------------

void ValidateBroadcastTensorShapesMatch(const TensorInfo& first,

                                        const TensorInfo& second,

                                        const TensorInfo& output,

                                        std::string const& descName,

                                        std::string const& firstName,

                                        std::string const& secondName)

{

    // Tensors must have the same number of dimensions in order to be explicit about which dimensions will get

    // broadcasted.

    // NOTE: This check is dependent on the AddBroadcastReshapeLayerImpl optimization having been applied to the layer.

    if (first.GetNumDimensions() != second.GetNumDimensions())

    {

        throw InvalidArgumentException(descName  + ": Tensors "

            + firstName + " & " + secondName

            + " must have the same number of dimensions in order to be broadcasted");

    }

    uint32_t numDims = first.GetNumDimensions();

    std::vector<uint32_t> outputDims(numDims, 0u);

    for (uint32_t i = 0; i < numDims; i++)

    {

        const bool dimsNotEqual = first.GetShape()[i] != second.GetShape()[i];

        const bool dimsNotOne = (first.GetShape()[i] != 1) && (second.GetShape()[i] != 1);

        if (dimsNotEqual && dimsNotOne)

        {

            throw InvalidArgumentException("Broadcasting is not possible for incompatible shapes");

        }

        outputDims[i] = std::max(first.GetShape()[i], second.GetShape()[i]);

    }

    TensorShape broadcastShape = TensorShape(armnn::numeric_cast<unsigned int>(outputDims.size()), outputDims.data());

    if (broadcastShape != output.GetShape())

    {

        throw InvalidArgumentException(descName + ": The tensor shape resulting from adding "

                                       + firstName + " & " + secondName

                                       + " does not match the output shape");

    }

}


//---------------------------------------------------------------

void ValidateDataTypes(const TensorInfo& info,

                       const std::vector<armnn::DataType>& supportedTypes,

                       std::string const& descName)

{

    auto iterator = std::find(supportedTypes.begin(), supportedTypes.end(), info.GetDataType());

    if (iterator == supportedTypes.end())

    {

        throw InvalidArgumentException(descName + ": " + " Tensor type " + GetDataTypeName(info.GetDataType()) +

                                       " is not supported.");

    }

}


//---------------------------------------------------------------

void ValidateTensorDataTypesMatch(const TensorInfo& first,

                                  const TensorInfo& second,

                                  std::string const& descName,

                                  std::string const& firstName,

                                  std::string const& secondName)

{

    if (first.GetDataType() != second.GetDataType())

    {

        throw InvalidArgumentException(descName + ": " + firstName + " & " + secondName +

                                       " must have identical data types.");

    }

}


//---------------------------------------------------------------

void ValidateTensorNumElementsMatch(const TensorInfo& first,

                                    const TensorInfo& second,

                                    std::string const& descName,

                                    std::string const& firstName,

                                    std::string const& secondName)

{

    if (first.GetNumElements() != second.GetNumElements())

    {

        throw InvalidArgumentException(descName + ": " + firstName + " & " + secondName +

                                       " must have the same number of elements.");

    }

}


void ValidateWeightDataType(const TensorInfo& inputInfo,

                            const TensorInfo& weightInfo,

                            const std::string& descName)

{

    const DataType inputType = inputInfo.GetDataType();

    if (IsQuantized8BitType(inputType))

    {

        const std::vector<DataType> validTypes =

        {

            DataType::QAsymmS8,

            DataType::QAsymmU8,

            DataType::QSymmS8

        };


        ValidateDataTypes(weightInfo, validTypes, descName);

    }

    else

    {

        ValidateTensorDataTypesMatch(inputInfo, weightInfo, descName, "input", "weight");

    }

}


void ValidatePerAxisQuantizationDimension(const TensorInfo& tensorInfo,

                                          const std::string& descName,

                                          const std::string& tensorName)

{

    const Optional<unsigned int>& quantizationDim = tensorInfo.GetQuantizationDim();

    if (!quantizationDim.has_value())

    {

        throw InvalidArgumentException(fmt::format("{0}: Quantization dimension for per-axis quantization "

                                                   "not set on tensor {1}.", descName, tensorName));

    }

}


void ValidatePerAxisQuantizationOffset(const TensorInfo& tensorInfo,

                                       const std::string& descName,

                                       const std::string& tensorName)

{

    int32_t quantizationOffset = tensorInfo.GetQuantizationOffset();

    if (quantizationOffset != 0)

    {

        throw InvalidArgumentException(fmt::format(

            "{0}: Quantization offset for per-axis quantization expected to be 0 on tensor {1}, but got: {2}",

            descName, tensorName, quantizationOffset));

    }

}


void ValidatePerAxisQuantization(const TensorInfo& inputInfo,

                                 const TensorInfo& outputInfo,

                                 const TensorInfo& weightInfo,

                                 const Optional<TensorInfo>& optionalBiasInfo,

                                 const std::string& descName)

{

    if (weightInfo.HasPerAxisQuantization())

    {

        const DataType inputDataType  = inputInfo.GetDataType();

        const DataType outputDataType = outputInfo.GetDataType();


        const bool canHavePerAxisQuantization = (IsQuantized8BitType(inputDataType)) && inputDataType == outputDataType;


        if (!canHavePerAxisQuantization)

        {

            throw InvalidArgumentException(fmt::format(

                "{0}: Per-axis quantization parameters set on tensor {1}, but data type does not support "

                "per-axis quantization.", descName, "weight"));

        }


        ValidPerAxisQuantizedDataType(weightInfo, descName, "weight");

        ValidatePerAxisQuantizationDimension(weightInfo, descName, "weight");

        ValidatePerAxisQuantizationOffset(weightInfo, descName, "weight");


        if (optionalBiasInfo.has_value())

        {

            const TensorInfo& biasInfo = optionalBiasInfo.value();

            if (!biasInfo.HasPerAxisQuantization())

            {

                throw InvalidArgumentException(fmt::format(

                        "{}: Per-axis quantization parameters not set on bias tensor, "

                        "despite being set on weight tensor.", descName));

            }


            ValidateTensorDataType(biasInfo, DataType::Signed32, descName, "bias");

            ValidatePerAxisQuantizationDimension(biasInfo, descName, "bias");

            ValidatePerAxisQuantizationOffset(biasInfo, descName, "bias");

        }

    }

}


} // anonymous namespace


//---------------------------------------------------------------

void QueueDescriptor::ValidateTensorNumDimensions(const TensorInfo& tensor,

                                                  std::string const& descName,

                                                  unsigned int numDimensions,

                                                  std::string const& tensorName) const

{

    // If we're allowing expanded dimensions then numDimensions becomes the minimum number of Dimensions we can allow.

    // Throw an Exception if the tensors has fewer than numDimensions or if the squeezed dimensions are greater than

    // numDimensions.

    if (m_AllowExpandedDims)

    {

        unsigned int squeezedDims = 0;


        for (unsigned int i = 0; i < tensor.GetNumDimensions(); ++i)

        {

            if (tensor.GetShape()[i] != 1)

            {

                ++squeezedDims;

            }

        }

        if (tensor.GetNumDimensions() < numDimensions || squeezedDims > numDimensions)

        {

            throw InvalidArgumentException(descName + ": Expected " + to_string(numDimensions) + " or less but got " +

                                           to_string(tensor.GetNumDimensions()) + " dimensions for " +

                                           tensorName + " tensor.");

        }

    }

    else

    {

        if (tensor.GetNumDimensions() != numDimensions)

        {

            throw InvalidArgumentException(descName + ": Expected " + to_string(numDimensions) + " but got " +

                                           to_string(tensor.GetNumDimensions()) + " dimensions for " +

                                           tensorName + " tensor.");

        }

    }

}


//---------------------------------------------------------------

void QueueDescriptor::ValidateTensorNumDimNumElem(const TensorInfo& tensorInfo,

                                                  unsigned int numDimension,

                                                  unsigned int numElements,

                                                  std::string const& tensorName) const

{

    const std::string functionName{"ValidateTensorNumDimNumElem"};

    ValidateTensorNumDimensions(tensorInfo, functionName, numDimension, tensorName);

    ValidateTensorNumElements(tensorInfo, functionName, numElements, tensorName);

}


//---------------------------------------------------------------

void QueueDescriptor::ValidateInputsOutputs(const std::string& descName,

    unsigned int numExpectedIn, unsigned int numExpectedOut) const

{

    ValidateTensors(m_Inputs, numExpectedIn, descName, "input");

    ValidateTensors(m_Outputs, numExpectedOut, descName, "output");

}


//---------------------------------------------------------------

void MapQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"MapQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 0);


    for (unsigned int i = 0; i < m_Inputs.size(); ++i)

    {

        if (!m_Inputs[i])

        {

            throw InvalidArgumentException(

                fmt::format("{}: Invalid NULL input {}.", descriptorName, static_cast<int>(i)));

        }

    }

}


//---------------------------------------------------------------

void UnmapQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"UnmapQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 0);


    for (unsigned int i = 0; i < m_Inputs.size(); ++i)

    {

        if (!m_Inputs[i])

        {

            throw InvalidArgumentException(

                fmt::format("{}: Invalid NULL input {}.", descriptorName, static_cast<int>(i)));

        }

    }

}


//---------------------------------------------------------------

void MemCopyQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"MemCopyQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName , 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorNumElementsMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");


    if (m_Inputs.size() != m_Outputs.size())

    {

        throw InvalidArgumentException(fmt::format(

            "{0}: Number of inputs ({1}) does not match the number of outputs ({2}).",

            descriptorName, m_Inputs.size(), m_Outputs.size()));

    }


    for (unsigned int i = 0; i < m_Inputs.size(); ++i)

    {

        if (!m_Inputs[i])

        {

            throw InvalidArgumentException(fmt::format(

                "{0}: Invalid NULL input {1}.", descriptorName, i));

        }


        if (!m_Outputs[i])

        {

            throw InvalidArgumentException(fmt::format("{0}: Invalid NULL output {1}", descriptorName, i));

        }

    }

}


//---------------------------------------------------------------

void MemImportQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    ValidateNumInputs(workloadInfo, "MemImportQueueDescriptor", 1);

    ValidateNumOutputs(workloadInfo, "MemImportQueueDescriptor" , 1);


    if (workloadInfo.m_InputTensorInfos.size() != 1)

    {

        throw InvalidArgumentException(fmt::format("Number of input infos ({}) is not 1.",

                                                   workloadInfo.m_InputTensorInfos.size()));


    }


    if (workloadInfo.m_InputTensorInfos.size() != workloadInfo.m_OutputTensorInfos.size())

    {

        throw InvalidArgumentException(fmt::format(

            "Number of input infos ({0}) does not match the number of output infos ({1})",

            workloadInfo.m_InputTensorInfos.size(), workloadInfo.m_OutputTensorInfos.size()));

    }


    for (std::size_t i = 0; i < workloadInfo.m_InputTensorInfos.size(); ++i)

    {

        if (workloadInfo.m_InputTensorInfos[i].GetNumElements() !=

            workloadInfo.m_OutputTensorInfos[i].GetNumElements())

        {

            throw InvalidArgumentException(fmt::format(

                "Number of elements for tensor input and output {} does not match", i ));

        }

    }


    if (m_Inputs.size() != 1)

    {

        throw InvalidArgumentException(fmt::format("Number of inputs ({}) is not 1.", m_Inputs.size()));

    }


    if (m_Inputs.size() != m_Outputs.size())

    {

        throw InvalidArgumentException(fmt::format(

            "Number of inputs ({0}) does not match the number of outputs ({1})",

            m_Inputs.size(), m_Outputs.size()));

    }


    for (unsigned int i = 0; i < m_Inputs.size(); ++i)

    {

        if (!m_Inputs[i])

        {

            throw InvalidArgumentException(fmt::format("Invalid null input {}", i));

        }


        if (!m_Outputs[i])

        {

            throw InvalidArgumentException(fmt::format("Invalid null output {}", i));

        }

    }

}


//---------------------------------------------------------------

void MemSyncQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    ValidateNumInputs(workloadInfo, "MemSyncQueueDescriptor", 1);


    if (m_Inputs.size() != 1)

    {

        throw InvalidArgumentException(fmt::format("Number of inputs ({}) is not 1.", m_Inputs.size()));

    }


    if (m_Outputs.size() != 0)

    {

        throw InvalidArgumentException(fmt::format("Number of outputs ({}) is not 0.", m_Outputs.size()));

    }


    if (!m_Inputs[0])

    {

        throw InvalidArgumentException(fmt::format("Invalid null input 0"));

    }

}


//---------------------------------------------------------------

void ActivationQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"ActivationQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

    ValidateTensorShapesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void ArgMinMaxQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"ArgMinMaxQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    if (outputTensorInfo.GetDataType() != DataType::Signed32 &&

        outputTensorInfo.GetDataType() != DataType::Signed64)

    {

        throw InvalidArgumentException(descriptorName + ": Output of ArgMinMax layer must be Int32 or Int64.");

    }


    std::vector<DataType> supportedInputTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16,

        DataType::Signed32,

        DataType::Signed64

    };


    ValidateDataTypes(inputTensorInfo, supportedInputTypes, descriptorName);


    auto inputShape = inputTensorInfo.GetShape();

    auto outputShape = outputTensorInfo.GetShape();


    auto inputNumDimensions = inputShape.GetNumDimensions();

    auto unsignedAxis = armnnUtils::GetUnsignedAxis(inputNumDimensions, m_Parameters.m_Axis);


    const std::string outputShapeError{": Output tensor shape does not match shape inferred from input tensor."};


    // 1D input shape results in scalar output shape

    if (inputShape.GetNumDimensions() == 1)

    {

        if (outputShape.GetNumDimensions() != 1 && outputShape[0] != 1)

        {

            throw InvalidArgumentException(descriptorName + outputShapeError);

        }

    }

    else

    {

        for (unsigned int i = 0; i < unsignedAxis; ++i)

        {

            if (outputShape[i] != inputShape[i])

            {

                throw InvalidArgumentException(descriptorName + outputShapeError);

            }

        }


        for (auto i = unsignedAxis + 1; i < inputNumDimensions; ++i)

        {

            if (outputShape[i - 1] != inputShape[i])

            {

                throw InvalidArgumentException(descriptorName + outputShapeError);

            }

        }

    }

}


void CastQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"CastQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

            DataType::BFloat16,

            DataType::Float16,

            DataType::Float32,

            DataType::QAsymmS8,

            DataType::QAsymmU8,

            DataType::QSymmS8,

            DataType::QSymmS16,

            DataType::Signed32,

            DataType::Signed64,

            DataType::Boolean

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateTensorShapesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void SoftmaxQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"SoftmaxQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

    ValidateTensorShapesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void SplitterQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"SplitterQueueDescriptor"};


    ValidateNumInputs(workloadInfo, descriptorName, 1);


    // Check the supported data types

    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

        DataType::Boolean,

        DataType::Signed32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    const TensorInfo& inputTensorInfo = workloadInfo.m_InputTensorInfos[0];

    for (unsigned long i = 0ul; i < workloadInfo.m_OutputTensorInfos.size(); ++i)

    {

        const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[i];

        ValidateDataTypes(outputTensorInfo, supportedTypes, descriptorName);


        const std::string outputName = "output_" + std::to_string(i);

        ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", outputName);

    }


    if (workloadInfo.m_OutputTensorInfos.size() <= 0)

    {

        throw InvalidArgumentException(descriptorName + ": At least one output needs to be provided.");

    }


    if (workloadInfo.m_OutputTensorInfos.size() != m_ViewOrigins.size())

    {

        throw InvalidArgumentException(

            descriptorName + ": Number of split windows "

            "has to match number of workloadInfo.m_OutputTensorInfos. "

            "Number of windows: " +

            to_string(m_ViewOrigins.size()) +

            ". Number of workloadInfo.m_OutputTensorInfos: " + to_string(workloadInfo.m_OutputTensorInfos.size()));

    }


    //The dimensionality of all the windows has to match the dimensionality (not shape) of the input.

    std::size_t inputDims = workloadInfo.m_InputTensorInfos[0].GetNumDimensions();

    for(unsigned int w = 0; w < m_ViewOrigins.size(); ++w )

    {

        //Checks that the dimensionality of input is same as the split windows.

        ViewOrigin const& e = m_ViewOrigins[w];

        if (e.m_Origin.size() != inputDims)

        {

            throw InvalidArgumentException(descriptorName + ": Window origin have to "

                                           "have the same dimensionality as the input tensor. "

                                           "Window origin (index: " +

                                           to_string(w) + ") has " + to_string(e.m_Origin.size()) +

                                           " dimensions, the input "

                                           "tensor has " +

                                           to_string(inputDims) + " dimensions.");

        }

        for (unsigned int i = 0; i < e.m_Origin.size(); ++i)

        {

            if (e.m_Origin[i] + workloadInfo.m_OutputTensorInfos[w].GetShape()[i] >

                workloadInfo.m_InputTensorInfos[0].GetShape()[i])

            {

                throw InvalidArgumentException(descriptorName + ": Window extent coordinates have to "

                                               "be smaller or equal than the size of the input in that coord.");

            }

        }

    }

}


void ConcatQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"ConcatQueueDescriptor"};


    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    if (m_Inputs.size() <= 0)

    {

        throw InvalidArgumentException(descriptorName + ": At least one input needs to be provided.");

    }

    if (m_Outputs.size() <= 0)

    {

        throw InvalidArgumentException(descriptorName + ": At least one output needs to be provided.");

    }


    if (workloadInfo.m_InputTensorInfos.size() <= 0)

    {

        throw InvalidArgumentException(descriptorName + ": At least one TensorInfo input needs to be provided.");

    }

    if (workloadInfo.m_OutputTensorInfos.size() <= 0)

    {

        throw InvalidArgumentException(descriptorName + ": At least one TensorInfo output needs to be provided.");

    }


    if(m_Parameters.GetConcatAxis() > workloadInfo.m_InputTensorInfos[0].GetShape().GetNumDimensions())

    {

        throw InvalidArgumentException(descriptorName + ": Invalid concatenation axis provided.");

    }


    if (workloadInfo.m_InputTensorInfos[0].GetShape().GetNumDimensions() - m_Parameters.GetConcatAxis() == 1)

    {

        return;

    }


    if (workloadInfo.m_InputTensorInfos.size() != m_ViewOrigins.size())

    {

        throw InvalidArgumentException(

            descriptorName + ": Number of split windows "

            "has to match number of workloadInfo.m_InputTensorInfos. "

            "Number of windows: " +

            to_string(m_ViewOrigins.size()) +

            ". Number of workloadInfo.m_InputTensorInfos: " + to_string(workloadInfo.m_InputTensorInfos.size()));

    }


    //The dimensionality of all the windows has to match the dimensionality (not shape) of the output.

    std::size_t outputDims = workloadInfo.m_OutputTensorInfos[0].GetNumDimensions();

    for(unsigned int w = 0; w < m_ViewOrigins.size(); ++w )

    {

        //Checks that the dimensionality of output is same as the split windows.

        ViewOrigin const& e = m_ViewOrigins[w];

        if (e.m_Origin.size() != outputDims)

        {

            throw InvalidArgumentException(descriptorName + ": Window origin have to "

                                           "have the same dimensionality as the output tensor. "

                                           "Window origin (index: " +

                                           to_string(w) + ") has " + to_string(e.m_Origin.size()) +

                                           " dimensions, the output "

                                           "tensor has " +

                                           to_string(outputDims) + " dimensions.");

        }

        //Checks that the merge windows are within the output tensor.

        for (unsigned int i = 0; i < e.m_Origin.size(); ++i)

        {

            if (e.m_Origin[i] + workloadInfo.m_InputTensorInfos[w].GetShape()[i]

                > workloadInfo.m_OutputTensorInfos[0].GetShape()[i])

            {

                throw InvalidArgumentException(descriptorName + ": Window extent coordinates have to "

                                               "be smaller or equal than the size of the output in that coord.");

            }

        }

    }


    // Check the supported data types

    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

        DataType::Boolean,

        DataType::Signed32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];

    for (unsigned long i = 0ul; i < workloadInfo.m_InputTensorInfos.size(); ++i)

    {

        const TensorInfo& inputTensorInfo = workloadInfo.m_InputTensorInfos[i];

        ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);


        const std::string inputName = "input_" + std::to_string(i);

        ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, inputName, "output");

    }

}


void StackQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"StackQueueDescriptor"};


    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    if (m_Parameters.m_NumInputs != workloadInfo.m_InputTensorInfos.size())

    {

        throw InvalidArgumentException(descriptorName + ": Must have the defined number of input tensors.");

    }


    // All inputs must have the same shape, which is defined in parameters

    const TensorShape& inputShape = m_Parameters.m_InputShape;

    for (unsigned int i = 0; i < workloadInfo.m_InputTensorInfos.size(); ++i)

    {

        if (workloadInfo.m_InputTensorInfos[i].GetShape() != inputShape)

        {

            throw InvalidArgumentException(descriptorName + ": All input tensor shapes must match the defined shape.");

        }

    }


    if (inputShape.GetNumDimensions() > 4)

    {

        throw InvalidArgumentException(descriptorName + ": Input tensor may have up to 4 dimensions.");

    }


    // m_Axis is 0-based and may take values from 0 to the number of input dimensions (inclusive),

    // since the output tensor has an additional dimension.

    if (m_Parameters.m_Axis > inputShape.GetNumDimensions())

    {

        throw InvalidArgumentException(descriptorName + ": Axis may not be greater "

                                       "than the number of input dimensions.");

    }


    // Output shape must be as inferred from the input shape

    const TensorShape& outputShape = workloadInfo.m_OutputTensorInfos[0].GetShape();

    for (unsigned int i = 0; i < m_Parameters.m_Axis; ++i)

    {

        if (outputShape[i] != inputShape[i])

        {

            throw InvalidArgumentException(descriptorName + ": Output tensor must "

                                           "match shape inferred from input tensor.");

        }

    }


    if (outputShape[m_Parameters.m_Axis] != m_Parameters.m_NumInputs)

    {

        throw InvalidArgumentException(descriptorName + ": Output tensor must "

                                       "match shape inferred from input tensor.");

    }


    for (unsigned int i = m_Parameters.m_Axis + 1; i < inputShape.GetNumDimensions() + 1; ++i)

    {

        if (outputShape[i] != inputShape[i-1])

        {

            throw InvalidArgumentException(descriptorName + ": Output tensor must "

                                           "match shape inferred from input tensor.");

        }

    }


    if (outputShape.GetNumDimensions() > 5)

    {

        throw InvalidArgumentException(descriptorName + ": Output tensor may have up to 5 dimensions.");

    }


    // Check the supported data types

    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

        DataType::Boolean,

        DataType::Signed32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(workloadInfo.m_InputTensorInfos[0], supportedTypes, descriptorName);


    for (unsigned int i = 1ul; i < workloadInfo.m_InputTensorInfos.size(); ++i)

    {

        ValidateTensorDataTypesMatch(workloadInfo.m_InputTensorInfos[0],

                                     workloadInfo.m_InputTensorInfos[i],

                                     descriptorName,

                                     "input_0",

                                     "input_" + std::to_string(i));

    }


    ValidateTensorDataTypesMatch(workloadInfo.m_InputTensorInfos[0],

                                 workloadInfo.m_OutputTensorInfos[0],

                                 descriptorName,

                                 "input_0",

                                 "output");

}


void FillQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"FillQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorNumDimensions(inputTensorInfo, descriptorName, 1, "input");


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

        DataType::Signed32

    };


    ValidateDataTypes(outputTensorInfo, supportedTypes, descriptorName);

}


void FullyConnectedQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"FullyConnectedQueueDescriptor"};


    uint32_t numInputs = 2;

    if (m_Parameters.m_BiasEnabled)

    {

        numInputs = 3;

    }


    ValidateNumInputs(workloadInfo, descriptorName, numInputs);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorNumDimensions(outputTensorInfo, descriptorName, 2, "output");


    if (!(inputTensorInfo.GetNumDimensions() == 2 || inputTensorInfo.GetNumDimensions() == 4))

    {

        throw InvalidArgumentException(descriptorName + ": Input tensor must have 2 or 4 dimensions.");

    }


    TensorInfo weightTensorInfo = workloadInfo.m_InputTensorInfos[1];

    ValidateTensorNumDimensions(weightTensorInfo, descriptorName, 2, "weight");


    if (m_Parameters.m_BiasEnabled)

    {

        TensorInfo biasTensorInfo = workloadInfo.m_InputTensorInfos[2];

        // Validates type and quantization values.

        ValidateBiasTensorQuantization(biasTensorInfo, weightTensorInfo, descriptorName);

        ValidateTensorDataType(biasTensorInfo, GetBiasDataType(inputTensorInfo.GetDataType()), descriptorName, "bias");

        ValidateTensorNumDimensions(biasTensorInfo, descriptorName, 1, "bias");

    }


    // Check the supported data types

    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);


    // For FullyConnected, we allow to have BFloat16 input with Float32 output for optimization.

    if (inputTensorInfo.GetDataType() == DataType::BFloat16)

    {

        if (outputTensorInfo.GetDataType() != DataType::BFloat16 && outputTensorInfo.GetDataType() != DataType::Float32)

        {

            throw InvalidArgumentException(descriptorName  + ": " + " Output tensor type must be BFloat16 or Float32 "

                                           "for BFloat16 input.");

        }

    }

    else

    {

        ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

    }

}


void FusedQueueDescriptor::Validate(const WorkloadInfo& /*workloadInfo*/) const

{

    // This is internally generated, so it should not need validation.

}


void NormalizationQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"NormalizationQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    // Check the supported data types

    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);


    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");


    ValidateTensorShapesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void AdditionQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"AdditionQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 2);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo0 = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& inputTensorInfo1 = workloadInfo.m_InputTensorInfos[1];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16,

        DataType::Signed32

    };


    ValidateDataTypes(inputTensorInfo0, supportedTypes, descriptorName);

    ValidateDataTypes(inputTensorInfo1, supportedTypes, descriptorName);

    ValidateDataTypes(outputTensorInfo, supportedTypes, descriptorName);


    ValidateTensorDataTypesMatch(inputTensorInfo0, inputTensorInfo1, descriptorName, "input_0", "input_1");

    ValidateTensorDataTypesMatch(inputTensorInfo1, outputTensorInfo, descriptorName, "input_1", "output");


    ValidateBroadcastTensorShapesMatch(inputTensorInfo0,

                                       inputTensorInfo1,

                                       outputTensorInfo,

                                       descriptorName,

                                       "input_0",

                                       "input_1");

}


void MultiplicationQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"MultiplicationQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 2);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo0 = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& inputTensorInfo1 = workloadInfo.m_InputTensorInfos[1];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16,

        DataType::Signed32

    };


    ValidateDataTypes(inputTensorInfo0, supportedTypes, descriptorName);

    ValidateDataTypes(inputTensorInfo1, supportedTypes, descriptorName);

    ValidateDataTypes(outputTensorInfo, supportedTypes, descriptorName);


    ValidateTensorDataTypesMatch(inputTensorInfo0, inputTensorInfo1, descriptorName, "input_0", "input_1");

    ValidateTensorDataTypesMatch(inputTensorInfo1, outputTensorInfo, descriptorName, "input_1", "output");


    ValidateBroadcastTensorShapesMatch(inputTensorInfo0,

                                       inputTensorInfo1,

                                       outputTensorInfo,

                                       descriptorName,

                                       "input_0",

                                       "input_1");

}


void BatchNormalizationQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"BatchNormalizationQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo,  supportedTypes, descriptorName);

    ValidateDataTypes(outputTensorInfo, supportedTypes, descriptorName);


    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

    ValidateTensorShapesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");


    ValidatePointer(m_Mean,     descriptorName, "mean");

    ValidatePointer(m_Variance, descriptorName, "variance");

    ValidatePointer(m_Beta,     descriptorName, "beta");

    ValidatePointer(m_Gamma,    descriptorName, "gamma");


    const TensorInfo& mean     = m_Mean->GetTensorInfo();

    const TensorInfo& variance = m_Variance->GetTensorInfo();

    const TensorInfo& beta     = m_Beta->GetTensorInfo();

    const TensorInfo& gamma    = m_Gamma->GetTensorInfo();


    ValidateTensorNumDimensions(mean,     descriptorName, 1, "mean");

    ValidateTensorNumDimensions(variance, descriptorName, 1, "variance");

    ValidateTensorNumDimensions(beta,     descriptorName, 1, "beta");

    ValidateTensorNumDimensions(gamma,    descriptorName, 1, "gamma");


    ValidateTensorShapesMatch(mean, variance, descriptorName, "mean", "variance");

    ValidateTensorShapesMatch(mean, beta,     descriptorName, "mean", "beta");

    ValidateTensorShapesMatch(mean, gamma,    descriptorName, "mean", "gamma");

}


void Convolution2dQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"Convolution2dQueueDescriptor"};


    uint32_t numInputs = 2;

    if (m_Parameters.m_BiasEnabled)

    {

        numInputs = 3;

    }


    ValidateNumInputs(workloadInfo,  descriptorName, numInputs);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorNumDimensions(inputTensorInfo,  descriptorName, 4, "input");

    ValidateTensorNumDimensions(outputTensorInfo, descriptorName, 4, "output");


    const TensorInfo& weightTensorInfo = workloadInfo.m_InputTensorInfos[1];


    ValidateTensorNumDimensions(weightTensorInfo, descriptorName, 4, "weight");


    ValidateWeightDataType(inputTensorInfo, weightTensorInfo, descriptorName);


    Optional<TensorInfo> optionalBiasTensorInfo;

    if (m_Parameters.m_BiasEnabled)

    {

        optionalBiasTensorInfo = MakeOptional<TensorInfo>(workloadInfo.m_InputTensorInfos[2]);

        const TensorInfo& biasTensorInfo = optionalBiasTensorInfo.value();


        ValidateTensorDataType(biasTensorInfo, GetBiasDataType(inputTensorInfo.GetDataType()), descriptorName, "bias");

        ValidateBiasTensorQuantization(biasTensorInfo, weightTensorInfo, descriptorName);

    }


    if (m_Parameters.m_StrideX <= 0 || m_Parameters.m_StrideY <= 0  )

    {

        throw InvalidArgumentException(

            fmt::format("{}: strideX (provided {}) and strideY (provided {}) "

                        "cannot be either negative or 0.",

                        descriptorName, m_Parameters.m_StrideX, m_Parameters.m_StrideY));

    }


    ValidatePerAxisQuantization(inputTensorInfo,

                                outputTensorInfo,

                                weightTensorInfo,

                                optionalBiasTensorInfo,

                                descriptorName);


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16,

        DataType::QSymmS8

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);


    // For Convolution2d, we allow to have BFloat16 input with Float32 output for optimization.

    if (inputTensorInfo.GetDataType() == DataType::BFloat16)

    {

        if (outputTensorInfo.GetDataType() != DataType::BFloat16 && outputTensorInfo.GetDataType() != DataType::Float32)

        {

            throw InvalidArgumentException(descriptorName  + ": " + " Output tensor type must be BFloat16 or Float32 "

                                           "for BFloat16 input.");

        }

    }

    else

    {

        ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

    }

}


void Convolution3dQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"Convolution3dQueueDescriptor"};


    uint32_t numInputs = 2;

    if (m_Parameters.m_BiasEnabled)

    {

        numInputs = 3;

    }

    ValidateNumInputs(workloadInfo,  descriptorName, numInputs);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorNumDimensions(inputTensorInfo,  descriptorName, 5, "input");

    ValidateTensorNumDimensions(outputTensorInfo, descriptorName, 5, "output");


    const TensorInfo& weightTensorInfo = workloadInfo.m_InputTensorInfos[1];

    ValidateTensorNumDimensions(weightTensorInfo, descriptorName, 5, "weight");


    ValidateWeightDataType(inputTensorInfo, weightTensorInfo, descriptorName);


    Optional<TensorInfo> optionalBiasTensorInfo;

    if (m_Parameters.m_BiasEnabled)

    {

        optionalBiasTensorInfo = MakeOptional<TensorInfo>(workloadInfo.m_InputTensorInfos[2]);

        const TensorInfo& biasTensorInfo = optionalBiasTensorInfo.value();


        ValidateTensorDataType(biasTensorInfo, GetBiasDataType(inputTensorInfo.GetDataType()), descriptorName, "bias");

        ValidateBiasTensorQuantization(biasTensorInfo, weightTensorInfo, descriptorName);

    }


    if (m_Parameters.m_StrideX <= 0 || m_Parameters.m_StrideY <= 0 || m_Parameters.m_StrideZ <= 0 )

    {

        throw InvalidArgumentException(

                fmt::format("{}: strideX (provided {}), strideY (provided {}) or strideZ (provided {})"

                            "cannot be either negative or 0.",

                            descriptorName, m_Parameters.m_StrideX, m_Parameters.m_StrideY, m_Parameters.m_StrideZ));

    }


    ValidatePerAxisQuantization(inputTensorInfo,

                                outputTensorInfo,

                                weightTensorInfo,

                                optionalBiasTensorInfo,

                                descriptorName);


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16,

        DataType::QSymmS8

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void DepthwiseConvolution2dQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"DepthwiseConvolution2dQueueDescriptor"};


    uint32_t numInputs = 2;

    if (m_Parameters.m_BiasEnabled)

    {

        numInputs = 3;

    }


    ValidateNumInputs(workloadInfo,  descriptorName, numInputs);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorNumDimensions(inputTensorInfo,  descriptorName, 4, "input");

    ValidateTensorNumDimensions(outputTensorInfo, descriptorName, 4, "output");


    const TensorInfo& weightTensorInfo = workloadInfo.m_InputTensorInfos[1];

    ValidateTensorNumDimensions(weightTensorInfo, descriptorName, 4, "weight");


    if (m_Parameters.m_DilationX < 1 || m_Parameters.m_DilationY < 1 )

    {

        throw InvalidArgumentException(

            fmt::format("{}: dilationX (provided {}) and dilationY (provided {}) "

                        "cannot be smaller than 1.",

                        descriptorName, m_Parameters.m_DilationX, m_Parameters.m_DilationX));

    }


    if (m_Parameters.m_StrideX <= 0 || m_Parameters.m_StrideY <= 0  )

    {

        throw InvalidArgumentException(

            fmt::format("{}: strideX (provided {}) and strideY (provided {}) "

                        "cannot be either negative or 0.",

                        descriptorName, m_Parameters.m_StrideX, m_Parameters.m_StrideY));

    }


    if (weightTensorInfo.GetShape()[0] != 1)

    {

        throw InvalidArgumentException(fmt::format(

                "{0}: The weight format in armnn is expected to be [1, H, W, Cout]."

                "But first dimension is not equal to 1. Provided weight shape: [{1}, {2}, {3}, {4}]",

                descriptorName,

                weightTensorInfo.GetShape()[0],

                weightTensorInfo.GetShape()[1],

                weightTensorInfo.GetShape()[2],

                weightTensorInfo.GetShape()[3]));

    }


    const unsigned int channelIndex = (m_Parameters.m_DataLayout == DataLayout::NCHW) ? 1 : 3;

    const unsigned int numWeightOutputChannelsRefFormat = weightTensorInfo.GetShape()[3];

    const unsigned int numWeightOutputChannelsAclFormat = weightTensorInfo.GetShape()[1];

    const unsigned int numOutputChannels = outputTensorInfo.GetShape()[channelIndex];


    // Weights format has two valid options: [1, H, W, Cout] (CpuRef) or [1, Cout, H, W] (CpuAcc/GpuAcc).

    bool validRefFormat = (numWeightOutputChannelsRefFormat == numOutputChannels);

    bool validAclFormat = (numWeightOutputChannelsAclFormat == numOutputChannels);


    if (!(validRefFormat || validAclFormat))

    {

        throw InvalidArgumentException(fmt::format(

            "{0}: The weight format in armnn is expected to be [1, H, W, Cout] (CpuRef) or [1, Cout, H, W] "

            "(CpuAcc/GpuAcc). But neither the 4th (CpuRef) or 2nd (CpuAcc/GpuAcc) dimension is equal to Cout."

            "Cout = {1} Provided weight shape: [{2}, {3}, {4}, {5}]",

            descriptorName,

            numOutputChannels,

            weightTensorInfo.GetShape()[0],

            weightTensorInfo.GetShape()[1],

            weightTensorInfo.GetShape()[2],

            weightTensorInfo.GetShape()[3]));

    }


    ValidateWeightDataType(inputTensorInfo, weightTensorInfo, descriptorName);


    Optional<TensorInfo> optionalBiasTensorInfo;

    if (m_Parameters.m_BiasEnabled)

    {

        optionalBiasTensorInfo = MakeOptional<TensorInfo>(workloadInfo.m_InputTensorInfos[2]);

        const TensorInfo& biasTensorInfo = optionalBiasTensorInfo.value();


        ValidateBiasTensorQuantization(biasTensorInfo, weightTensorInfo, descriptorName);

        ValidateTensorDataType(biasTensorInfo, GetBiasDataType(inputTensorInfo.GetDataType()), descriptorName, "bias");

    }

    ValidatePerAxisQuantization(inputTensorInfo,

                                outputTensorInfo,

                                weightTensorInfo,

                                optionalBiasTensorInfo,

                                descriptorName);


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void PermuteQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"PermuteQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const PermutationVector& mapping = m_Parameters.m_DimMappings;


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorNumDimensions(inputTensorInfo,  descriptorName, mapping.GetSize(), "input");

    ValidateTensorNumDimensions(outputTensorInfo, descriptorName, mapping.GetSize(), "output");


    for (unsigned int i = 0u; i < mapping.GetSize(); ++i)

    {

        if (inputTensorInfo.GetShape()[i] != outputTensorInfo.GetShape()[mapping[i]])

        {

            throw InvalidArgumentException(descriptorName + ": src dimension " + to_string(i) +

                                           " (=" + to_string(inputTensorInfo.GetShape()[i]) + ") " +

                                           "must match dst dimension " + to_string(mapping[i]) +

                                           " (=" + to_string(outputTensorInfo.GetShape()[mapping[i]]) + ")");

        }

    }


    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void Pooling2dQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"Pooling2dQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorNumDimensions(inputTensorInfo,  descriptorName, 4, "input");

    ValidateTensorNumDimensions(outputTensorInfo, descriptorName, 4, "output");


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void Pooling3dQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"Pooling3dQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorNumDimensions(inputTensorInfo,  descriptorName, 5, "input");

    ValidateTensorNumDimensions(outputTensorInfo, descriptorName, 5, "output");


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void ResizeQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"ResizeQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorNumDimensions(inputTensorInfo,  descriptorName, 4, "input");

    ValidateTensorNumDimensions(outputTensorInfo, descriptorName, 4, "output");


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");


    // Resize only changes width and height: batch and channel count must match.

    const unsigned int inputBatchSize  = inputTensorInfo.GetShape()[0];

    const unsigned int outputBatchSize = outputTensorInfo.GetShape()[0];

    if (inputBatchSize != outputBatchSize)

    {

        throw InvalidArgumentException(

                fmt::format("{}: Input batch size ({}) does not match output batch size ({})",

                            descriptorName, inputBatchSize, outputBatchSize));

    }


    DataLayoutIndexed dimensionIndices(m_Parameters.m_DataLayout);

    const unsigned int inputChannelCount  = inputTensorInfo.GetShape()[dimensionIndices.GetChannelsIndex()];

    const unsigned int outputChannelCount = outputTensorInfo.GetShape()[dimensionIndices.GetChannelsIndex()];

    if (inputChannelCount != outputChannelCount)

    {

        throw InvalidArgumentException(

                fmt::format("{}: Input channel count ({}) does not match output channel count ({})",

                            descriptorName, inputChannelCount, outputChannelCount));

    }

}


void ReverseV2QueueDescriptor::Validate(const WorkloadInfo &workloadInfo) const

{

    const std::string descriptorName{"ReverseV2QueueDescriptor"};


    // Backend restriction

    const unsigned int maxDimensions = 4;


    ValidateNumInputs(workloadInfo,  descriptorName, 2);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& axisTensorInfo  = workloadInfo.m_InputTensorInfos[1];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    const auto inputTensorNumDimensions = inputTensorInfo.GetNumDimensions();

    if (inputTensorNumDimensions > maxDimensions)

    {

        throw InvalidArgumentException(descriptorName +

            ": Input tensors with rank greater than " +

            std::to_string(maxDimensions) + " are not supported.");

    }


    const auto axisTensorNumDimensions = axisTensorInfo.GetNumDimensions();

    if (axisTensorNumDimensions > maxDimensions)

    {

        throw InvalidArgumentException(descriptorName +

            ": More than " + std::to_string(maxDimensions) + " axes cannot be specified.");

    }


    if (axisTensorNumDimensions > inputTensorNumDimensions)

    {

        throw InvalidArgumentException(descriptorName +

            ": More axes specified than the number of axes on the input tensor.");

    }


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS8,

        DataType::QSymmS16,

        DataType::Signed32

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);


    std::vector<DataType> axisSupportedTypes =

    {

        DataType::Signed32,

    };


    ValidateDataTypes(axisTensorInfo, axisSupportedTypes, descriptorName);


    ValidateTensorShapesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void FakeQuantizationQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"FakeQuantizationQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorNumDimensions(inputTensorInfo,  descriptorName, 2, "input");

    ValidateTensorNumDimensions(outputTensorInfo, descriptorName, 2, "output");


    ValidateTensorShapesMatch(inputTensorInfo, outputTensorInfo,  descriptorName, "input", "output");


    if (m_Parameters.m_Min > m_Parameters.m_Max)

    {

        throw InvalidArgumentException(descriptorName + ": min cannot be greater than max");

    }

}


void InstanceNormalizationQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"InstanceNormalizationQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    if (inputTensorInfo.GetNumDimensions() > 4)

    {

        throw InvalidArgumentException(descriptorName + ": Input tensors with rank greater than 4 are not supported.");

    }


    ValidateTensorShapesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");


    // Check the supported data types

    std::vector<DataType> supportedTypes =

        {

            DataType::BFloat16,

            DataType::Float32,

            DataType::Float16

        };


    ValidateDataTypes(inputTensorInfo,  supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void L2NormalizationQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"L2NormalizationQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    if (inputTensorInfo.GetNumDimensions() > 4)

    {

        throw InvalidArgumentException(descriptorName + ": Input tensors with rank greater than 4 are not supported.");

    }


    ValidateTensorShapesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");


    // Check the supported data types

    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo,  supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void LogSoftmaxQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"LogSoftmaxQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorShapesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

    };


    ValidateDataTypes(inputTensorInfo,  supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void ConstantQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"ConstantQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 0);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    if (!m_LayerOutput)

    {

        throw InvalidArgumentException(descriptorName + ": No const input specified.");

    }


    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];

    ValidateTensorShapesMatch(m_LayerOutput->GetTensorInfo(), outputTensorInfo, descriptorName, "constant", "output");


    // Check the supported data types

    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS8,

        DataType::QSymmS16,

        DataType::Signed32

    };


    ValidateDataTypes(outputTensorInfo, supportedTypes, descriptorName);

}


void ReshapeQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"ReshapeQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorNumElementsMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");


    // Check the supported data types

    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16,

        DataType::Signed32,

        DataType::Boolean

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void SpaceToBatchNdQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"SpaceToBatchNdQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    if (m_Parameters.m_BlockShape.size() != m_Parameters.m_PadList.size())

    {

        throw InvalidArgumentException(descriptorName + ": Pad List must contain the same number of "

                                       "dimensions as Block Shape.");

    }


    if (m_Parameters.m_BlockShape.size() == 2)

    {

        ValidateTensorNumDimensions(inputTensorInfo,  descriptorName, 4, "input");

        ValidateTensorNumDimensions(outputTensorInfo, descriptorName, 4, "output");

    }

    else if (m_Parameters.m_BlockShape.size() == 1)

    {

        ValidateTensorNumDimensions(inputTensorInfo,  descriptorName, 3, "input");

        ValidateTensorNumDimensions(outputTensorInfo, descriptorName, 3, "output");

    }

    else

    {

        throw InvalidArgumentException(descriptorName + ": Invalid Block and Crops size.");

    }


    // Check input + padding and output have the same number of elements

    DataLayoutIndexed dimensionIndices(m_Parameters.m_DataLayout);

    const unsigned int inputHeight = inputTensorInfo.GetShape()[dimensionIndices.GetHeightIndex()] +

                                     m_Parameters.m_PadList[0].first + m_Parameters.m_PadList[0].second;

    const unsigned int inputWidth = (inputTensorInfo.GetNumDimensions() == 3) ? 1 :

                                    inputTensorInfo.GetShape()[dimensionIndices.GetWidthIndex()] +

                                    m_Parameters.m_PadList[1].first + m_Parameters.m_PadList[1].second;


    const int channelsIndex_int = (m_Parameters.m_DataLayout == DataLayout::NCHW) ? 1 : -1;

    const unsigned int channelsIndex = channelsIndex_int < 0 ?

            static_cast<unsigned int>(channelsIndex_int) + inputTensorInfo.GetNumDimensions()

            : static_cast<unsigned int>(channelsIndex_int);


    const unsigned int numInputElements = inputTensorInfo.GetShape()[0] *

                                          inputHeight *

                                          inputWidth *

                                          inputTensorInfo.GetShape()[channelsIndex];


    if (outputTensorInfo.GetNumElements() != numInputElements)

    {

        throw InvalidArgumentException(descriptorName + ": Input tensor has " +

                                       to_string(numInputElements) + " after padding but output tensor has " +

                                       to_string(outputTensorInfo.GetNumElements()) + " elements.");

    }


    // In a 4D tensor, there will be 2 spatialDimensions (H and W), and the for loop will run twice.

    // In a 3D tensor, there will be 1 spatialDimensions, and the for loop will run once.

    unsigned int firstSpatialDimension = m_Parameters.m_DataLayout == DataLayout::NCHW ? 2 : 1;

    for (unsigned int i = 0; i < m_Parameters.m_BlockShape.size(); ++i)

    {

        unsigned int spatialDimension = firstSpatialDimension + i;

        auto inputSize = inputTensorInfo.GetShape()[spatialDimension] +

                         m_Parameters.m_PadList[i].first +

                         m_Parameters.m_PadList[i].second;

        if (inputSize % m_Parameters.m_BlockShape[i] != 0)

        {

            throw InvalidArgumentException(descriptorName + ": Input dimension size after padding must be "

                                        "divisible by Block Shape in dimension: " + to_string(spatialDimension) + ".");

        }

    }


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void SpaceToDepthQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"SpaceToDepthQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorNumDimensions(inputTensorInfo,  descriptorName, 4, "input");

    ValidateTensorNumDimensions(outputTensorInfo, descriptorName, 4, "output");


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo,  supportedTypes, descriptorName);

    ValidateDataTypes(outputTensorInfo, supportedTypes, descriptorName);


    ValidateTensorNumElementsMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");


    if (m_Parameters.m_BlockSize == 0)

    {

        throw InvalidArgumentException(descriptorName + ": Block size cannot be 0.");

    }


    DataLayoutIndexed dimensionIndices(m_Parameters.m_DataLayout);

    const unsigned int wIndex = dimensionIndices.GetWidthIndex();

    const unsigned int hIndex = dimensionIndices.GetHeightIndex();

    const unsigned int cIndex = dimensionIndices.GetChannelsIndex();


    const TensorShape& inputShape = inputTensorInfo.GetShape();

    if (inputShape[hIndex] % m_Parameters.m_BlockSize != 0 || inputShape[wIndex]  % m_Parameters.m_BlockSize != 0)

    {

        throw InvalidArgumentException(descriptorName + ": Input shape must be divisible "

                                       "by block size in all spatial dimensions");

    }


    const TensorShape& outputShape = outputTensorInfo.GetShape();

    if (outputShape[cIndex] % (m_Parameters.m_BlockSize * m_Parameters.m_BlockSize) != 0)

    {

        throw InvalidArgumentException(descriptorName + ": The depth of the output tensor"

                                       "must be divisible by the square of block size." );

    }

}


void FloorQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"FloorQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo,  supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

    ValidateTensorShapesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

    ValidateTensorQuantizationSpace(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void LstmQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    // ported from android/ml/nn/common/operations/LSTM.cpp CheckInputTensorDimensions()


    const std::string descriptorName{"LstmQueueDescriptor"};


    // check dimensions of all inputs and outputs

    if (workloadInfo.m_InputTensorInfos.size() != 3)

    {

        throw InvalidArgumentException(descriptorName + ": Invalid number of inputs.");

    }

    if (workloadInfo.m_OutputTensorInfos.size() != 4)

    {

        throw InvalidArgumentException(descriptorName + ": Invalid number of outputs.");

    }


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QSymmS16

    };


    // check for supported type of one input and match them with all the other input and output

    ValidateDataTypes(workloadInfo.m_InputTensorInfos[0], supportedTypes, descriptorName);


    // type matches all other inputs

    for (uint32_t i = 1u; i < workloadInfo.m_InputTensorInfos.size(); ++i)

    {

        ValidateTensorDataTypesMatch(workloadInfo.m_InputTensorInfos[0],

                                     workloadInfo.m_InputTensorInfos[i],

                                     descriptorName,

                                     "input_0",

                                     "input_" + std::to_string(i));

    }

    // type matches all other outputs

    for (uint32_t i = 0u; i < workloadInfo.m_OutputTensorInfos.size(); ++i)

    {

        ValidateTensorDataTypesMatch(workloadInfo.m_InputTensorInfos[0],

                                     workloadInfo.m_OutputTensorInfos[i],

                                     "LstmQueueDescriptor",

                                     "input_0",

                                     "output_" + std::to_string(i));

    }


    // Making sure clipping parameters have valid values.

    // == 0 means no clipping

    //  > 0 means clipping

    if (m_Parameters.m_ClippingThresCell < 0.0f)

    {

        throw InvalidArgumentException(descriptorName + ": negative cell clipping threshold is invalid");

    }

    if (m_Parameters.m_ClippingThresProj < 0.0f)

    {

        throw InvalidArgumentException(descriptorName + ": negative projection clipping threshold is invalid");

    }


    // Inferring batch size, number of outputs and number of cells from the inputs.

    const uint32_t n_input = workloadInfo.m_InputTensorInfos[0].GetShape()[1];

    const uint32_t n_batch = workloadInfo.m_InputTensorInfos[0].GetShape()[0];

    ValidatePointer(m_InputToOutputWeights, "Null pointer check", "InputToOutputWeights");

    const uint32_t n_cell = m_InputToOutputWeights->GetShape()[0];

    ValidatePointer(m_RecurrentToOutputWeights, "Null pointer check", "RecurrentToOutputWeights");

    const uint32_t n_output = m_RecurrentToOutputWeights->GetShape()[1];


    // input tensor

    ValidateTensorNumDimNumElem(workloadInfo.m_InputTensorInfos[0], 2, (n_batch * n_input),

                                descriptorName + " input_0");

    // outputStateInTensor

    ValidateTensorNumDimNumElem(workloadInfo.m_InputTensorInfos[1], 2, (n_batch * n_output),

                                descriptorName + " input_1");

    // outputStateInTensor

    ValidateTensorNumDimNumElem(workloadInfo.m_InputTensorInfos[2], 2, (n_batch * n_cell),

                                descriptorName + " input_2");

    // scratchBufferTensor

    unsigned int scratchBufferSize = m_Parameters.m_CifgEnabled ? n_cell * 3 : n_cell * 4;

    ValidateTensorNumDimNumElem(workloadInfo.m_OutputTensorInfos[0], 2, (n_batch * scratchBufferSize),

                                descriptorName + " output_0");

    // outputStateOutTensor

    ValidateTensorNumDimNumElem(workloadInfo.m_OutputTensorInfos[1], 2, (n_batch * n_output),

                                descriptorName + " output_1");

    // cellStateOutTensor

    ValidateTensorNumDimNumElem(workloadInfo.m_OutputTensorInfos[2], 2, (n_batch * n_cell),

                                descriptorName + " output_2");

    // outputTensor

    ValidateTensorNumDimNumElem(workloadInfo.m_OutputTensorInfos[3], 2, (n_batch * n_output),

                                descriptorName + " output_3");


    // check that dimensions of inputs/outputs and QueueDescriptor data match with each other

    if ( m_InputToInputWeights )

    {

        ValidateTensorNumDimNumElem(m_InputToInputWeights->GetTensorInfo(), 2,

                                      (n_cell * n_input), "InputLayerNormWeights");

    }


    ValidatePointer(m_InputToForgetWeights, "Null pointer check", "InputToForgetWeights");

    ValidateTensorNumDimNumElem(m_InputToForgetWeights->GetTensorInfo(), 2,

                                  (n_cell * n_input), "InputToForgetWeights");


    ValidatePointer(m_InputToCellWeights, "Null pointer check", "InputToCellWeights");

    ValidateTensorNumDimNumElem(m_InputToCellWeights->GetTensorInfo(), 2,

                                  (n_cell * n_input), "InputToCellWeights");


    if ( m_RecurrentToInputWeights )

    {

        ValidateTensorNumDimNumElem(m_RecurrentToInputWeights->GetTensorInfo(), 2,

                                      (n_cell * n_output), "RecurrentToInputWeights");

    }


    ValidatePointer(m_RecurrentToForgetWeights, "Null pointer check", "RecurrentToForgetWeights");

    ValidateTensorNumDimNumElem(m_RecurrentToForgetWeights->GetTensorInfo(), 2,

                                  (n_cell * n_output), "RecurrentToForgetWeights");


    ValidatePointer(m_RecurrentToCellWeights, "Null pointer check", "RecurrentToCellWeights");

    ValidateTensorNumDimNumElem(m_RecurrentToCellWeights->GetTensorInfo(), 2,

                                  (n_cell * n_output), "RecurrentToCellWeights");


    // Make sure the input-gate's parameters are either both present (regular

    // LSTM) or not at all (CIFG-LSTM). And CifgEnable is set accordingly.

    bool cifg_weights_all_or_none = ((m_InputToInputWeights && m_RecurrentToInputWeights &&

                                     !m_Parameters.m_CifgEnabled) ||

                                     (!m_InputToInputWeights && !m_RecurrentToInputWeights &&

                                     m_Parameters.m_CifgEnabled));

    if (!cifg_weights_all_or_none)

    {

        throw InvalidArgumentException(descriptorName + ": Input-Gate's parameters InputToInputWeights and "

                                       "RecurrentToInputWeights must either both be present (regular LSTM) "

                                       "or both not present (CIFG-LSTM). In addition CifgEnable must be set "

                                       "accordingly.");

    }


    if ( m_CellToInputWeights )

    {

        ValidateTensorNumDimNumElem(m_CellToInputWeights->GetTensorInfo(), 1,

                                      n_cell, "CellToInputWeights");

    }

    if ( m_CellToForgetWeights )

    {

        ValidateTensorNumDimNumElem(m_CellToForgetWeights->GetTensorInfo(), 1,

                                      n_cell, "CellToForgetWeights");

    }

    if ( m_CellToOutputWeights )

    {

        ValidateTensorNumDimNumElem(m_CellToOutputWeights->GetTensorInfo(), 1,

                                      n_cell, "CellToOutputWeights");

    }


    // Making sure the peephole weights are there all or none. And PeepholeEnable is set accordingly.

    bool peephole_weights_all_or_none =

            (((m_CellToInputWeights || m_Parameters.m_CifgEnabled) &&  m_CellToForgetWeights

            && m_CellToOutputWeights && m_Parameters.m_PeepholeEnabled)

            || ( !m_CellToInputWeights && !m_CellToForgetWeights

            && !m_CellToOutputWeights && !m_Parameters.m_PeepholeEnabled));

    if (!peephole_weights_all_or_none)

    {

        throw InvalidArgumentException(descriptorName + ": Invalid combination of peephole parameters.");

    }


    // Make sure the input gate bias is present only when not a CIFG-LSTM.

    if (m_Parameters.m_CifgEnabled)

    {

        if (m_InputGateBias)

        {

            throw InvalidArgumentException(descriptorName + ": InputGateBias is present and CIFG-LSTM is enabled.");

        }

    }

    else

    {

        if (!m_InputGateBias)

        {

            throw InvalidArgumentException(descriptorName + ": If CIFG-LSTM is disabled InputGateBias "

                                           "must be present.");

        }

        ValidateTensorNumDimNumElem(m_InputGateBias->GetTensorInfo(), 1,

                                      n_cell, "InputGateBias");

    }


    ValidatePointer(m_ForgetGateBias, "Null pointer check", "ForgetGateBias");

    ValidateTensorNumDimNumElem(m_ForgetGateBias->GetTensorInfo(), 1, n_cell, "ForgetGateBias");


    ValidatePointer(m_CellBias, "Null pointer check", "CellBias");

    ValidateTensorNumDimNumElem(m_CellBias->GetTensorInfo(), 1, n_cell, "CellBias");


    ValidatePointer(m_OutputGateBias, "Null pointer check", "OutputGateBias");

    ValidateTensorNumDimNumElem(m_OutputGateBias->GetTensorInfo(), 1, n_cell, "OutputGateBias");


    if (m_ProjectionWeights)

    {

        ValidateTensorNumDimNumElem(m_ProjectionWeights->GetTensorInfo(), 2,

                                      (n_cell * n_output), "ProjectionWeights");

    }

    if (m_ProjectionBias)

    {

        ValidateTensorNumDimNumElem(m_ProjectionBias->GetTensorInfo(), 1, n_output, "ProjectionBias");

    }


    // Making sure the projection tensors are consistent:

    // 1) If projection weight is not present, then projection bias should not be

    // present.

    // 2) If projection weight is present, then projection bias is optional.

    bool projecton_tensors_consistent = ((!m_ProjectionWeights && !m_ProjectionBias &&

                                        !m_Parameters.m_ProjectionEnabled)

                                        || (m_ProjectionWeights && !m_ProjectionBias &&

                                        m_Parameters.m_ProjectionEnabled)

                                        || (m_ProjectionWeights && m_ProjectionBias &&

                                        m_Parameters.m_ProjectionEnabled));

    if (!projecton_tensors_consistent)

    {

        throw InvalidArgumentException(descriptorName + ": Projection tensors are inconsistent.");

    }


    // The four layer normalization weights either all have values or none of them have values. Additionally, if

    // CIFG is used, input layer normalization weights tensor is omitted and the other layer normalization weights

    // either all have values or none of them have values. Layer normalization is used when the values of all the

    // layer normalization weights are present

    if (m_InputLayerNormWeights)

    {

        ValidateTensorNumDimNumElem(m_InputLayerNormWeights->GetTensorInfo(), 1, n_cell, "InputLayerNormWeights");

    }

    if (m_ForgetLayerNormWeights)

    {

        ValidateTensorNumDimNumElem(m_ForgetLayerNormWeights->GetTensorInfo(), 1, n_cell, "ForgetLayerNormWeights");

    }

    if (m_CellLayerNormWeights)

    {

        ValidateTensorNumDimNumElem(m_CellLayerNormWeights->GetTensorInfo(), 1, n_cell, "CellLayerNormWeights");

    }

    if (m_OutputLayerNormWeights)

    {

        ValidateTensorNumDimNumElem(m_OutputLayerNormWeights->GetTensorInfo(), 1, n_cell, "OutputLayerNormWeights");

    }


    if (m_Parameters.m_LayerNormEnabled)

    {

        if (!m_Parameters.m_CifgEnabled)

        {

            if (!m_InputLayerNormWeights)

            {

                throw InvalidArgumentException(descriptorName + ": Layer normalisation is enabled and CIFG-LSTM is "

                                               "disabled but InputLayerNormWeights are not present");

            }

            ValidateTensorNumDimNumElem(m_InputLayerNormWeights->GetTensorInfo(),

                                          1, n_cell, "InputLayerNormWeights");

        }

        else if (m_InputLayerNormWeights)

        {

            throw InvalidArgumentException(descriptorName + ":InputLayerNormWeights are present while CIFG is "

                                           "enabled");

        }


        ValidatePointer(m_ForgetLayerNormWeights, "Null pointer check layer normalisation enabled",

                        "ForgetLayerNormWeights");

        ValidateTensorNumDimNumElem(m_ForgetLayerNormWeights->GetTensorInfo(), 1, n_cell, "ForgetLayerNormWeights");


        ValidatePointer(m_OutputLayerNormWeights, "Null pointer check layer normalisation enabled",

                        "OutputLayerNormWeights");

        ValidateTensorNumDimNumElem(m_OutputLayerNormWeights->GetTensorInfo(), 1, n_cell, "OutputLayerNormWeights");


        ValidatePointer(m_CellLayerNormWeights, "Null pointer check layer normalisation enabled",

                        "CellLayerNormWeights");

        ValidateTensorNumDimNumElem(m_CellLayerNormWeights->GetTensorInfo(), 1, n_cell, "CellLayerNormWeights");

    }

    else if (m_InputLayerNormWeights || m_ForgetLayerNormWeights || m_OutputLayerNormWeights || m_CellLayerNormWeights)

    {

        throw InvalidArgumentException(descriptorName + ": Layer normalisation is disabled but one or more layer "

                                       "normalisation weights are present.");

    }

}


void ConvertFp32ToFp16QueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"ConvertFp32ToFp16QueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    if (inputTensorInfo.GetDataType() != DataType::Float32)

    {

        throw InvalidArgumentException(descriptorName + ": Input tensor type must be Float32.");

    }


    if (outputTensorInfo.GetDataType() != DataType::Float16)

    {

        throw InvalidArgumentException(descriptorName + ": Output tensor type must be Float16.");

    }


    ValidateTensorShapesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void ConvertFp16ToFp32QueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"ConvertFp16ToFp32QueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    if (inputTensorInfo.GetDataType() != DataType::Float16)

    {

        throw InvalidArgumentException(descriptorName + ": Input tensor type must be Float16.");

    }


    if (outputTensorInfo.GetDataType() != DataType::Float32)

    {

        throw InvalidArgumentException(descriptorName + ": Output tensor type must be Float32.");

    }


    ValidateTensorShapesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void DivisionQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"DivisionQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 2);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo0 = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& inputTensorInfo1 = workloadInfo.m_InputTensorInfos[1];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16,

        DataType::Signed32

    };


    ValidateDataTypes(inputTensorInfo0, supportedTypes, descriptorName);

    ValidateDataTypes(inputTensorInfo1, supportedTypes, descriptorName);

    ValidateDataTypes(outputTensorInfo, supportedTypes, descriptorName);


    ValidateBroadcastTensorShapesMatch(inputTensorInfo0,

                                       inputTensorInfo1,

                                       outputTensorInfo,

                                       descriptorName,

                                       "input_0",

                                       "input_1");

}


void SubtractionQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"SubtractionQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 2);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo0 = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& inputTensorInfo1 = workloadInfo.m_InputTensorInfos[1];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16,

        DataType::Signed32,

    };


    ValidateDataTypes(inputTensorInfo0, supportedTypes, descriptorName);

    ValidateDataTypes(inputTensorInfo1, supportedTypes, descriptorName);

    ValidateDataTypes(outputTensorInfo, supportedTypes, descriptorName);


    ValidateBroadcastTensorShapesMatch(inputTensorInfo0,

                                       inputTensorInfo1,

                                       outputTensorInfo,

                                       descriptorName,

                                       "input_0",

                                       "input_1");

}


void MaximumQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"MaximumQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 2);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo0 = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& inputTensorInfo1 = workloadInfo.m_InputTensorInfos[1];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16,

        DataType::Signed32

    };


    ValidateDataTypes(inputTensorInfo0, supportedTypes, descriptorName);

    ValidateDataTypes(inputTensorInfo1, supportedTypes, descriptorName);

    ValidateDataTypes(outputTensorInfo, supportedTypes, descriptorName);


    ValidateBroadcastTensorShapesMatch(inputTensorInfo0,

                                       inputTensorInfo1,

                                       outputTensorInfo,

                                       descriptorName,

                                       "input_0",

                                       "input_1");

}


void MeanQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"MeanQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    // First check if input tensor data type is supported, then

    // check if this data type matches the output tensor data type

    ValidateDataTypes(inputTensorInfo,  supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");


    if (m_Parameters.m_KeepDims)

    {

        ValidateTensorNumDimensions(outputTensorInfo, descriptorName, inputTensorInfo.GetNumDimensions(), "output");

    }

    else if (m_Parameters.m_Axis.empty())

    {

        ValidateTensorNumDimensions(outputTensorInfo, descriptorName, 1, "output");

    }

    else

    {

        unsigned int outputDim =

            inputTensorInfo.GetNumDimensions() - armnn::numeric_cast<unsigned int>(m_Parameters.m_Axis.size());

        ValidateTensorNumDimensions(outputTensorInfo,

                                    descriptorName,

                                    outputDim > 0 ? outputDim : 1,

                                    "output");

    }

}


void PadQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"PadQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    // input and output should have the same number of dimensions

    ValidateTensorNumDimensions(outputTensorInfo, descriptorName, inputTensorInfo.GetNumDimensions(), "output");


    // there should be entry in the pad list for each dimension in the input tensor

    if (m_Parameters.m_PadList.size() != inputTensorInfo.GetNumDimensions()) {

        throw InvalidArgumentException(descriptorName + ":Pad List should contain the same number of entries "

                                       "as there are dimensions in the input tensor that is " +

                                       std::to_string(inputTensorInfo.GetNumDimensions()) + " entries " +

                                       " not " + std::to_string(m_Parameters.m_PadList.size()) + " entries.");

    }

}


void QuantizeQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"QuantizeQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

        DataType::QSymmS8,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);


    if (!IsQuantizedType(outputTensorInfo.GetDataType()))

    {

        throw InvalidArgumentException(descriptorName + ": Output of quantized layer must be quantized type.");

    }

}


void BatchToSpaceNdQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"BatchToSpaceNdQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    if (m_Parameters.m_BlockShape.size() != m_Parameters.m_Crops.size())

    {

        throw InvalidArgumentException(descriptorName + ": Crops must contain the same number of "

                                                        "dimensions as Block Shape.");

    }


    if (m_Parameters.m_BlockShape.size() == 2)

    {

        ValidateTensorNumDimensions(inputTensorInfo,  descriptorName, 4, "input");

        ValidateTensorNumDimensions(outputTensorInfo, descriptorName, 4, "output");

    }

    else if (m_Parameters.m_BlockShape.size() == 1)

    {

        ValidateTensorNumDimensions(inputTensorInfo,  descriptorName, 3, "input");

        ValidateTensorNumDimensions(outputTensorInfo, descriptorName, 3, "output");

    }

    else

    {

        throw InvalidArgumentException(descriptorName + ": Invalid Block and Crops size.");

    }


    // In a 4D tensor, there will be 2 spatialDimensions (H and W), and the for loop will run twice.

    // In a 3D tensor, there will be 1 spatialDimensions, and the for loop will run once.

    unsigned int firstSpatialDimension = m_Parameters.m_DataLayout == DataLayout::NCHW ? 2 : 1;

    for (unsigned int i = 0; i < m_Parameters.m_BlockShape.size(); ++i)

    {

        unsigned int spatialDimension = firstSpatialDimension + i;

        unsigned int cropSize = m_Parameters.m_Crops[i].first + m_Parameters.m_Crops[i].second;

        unsigned int outputSize = inputTensorInfo.GetShape()[spatialDimension] * m_Parameters.m_BlockShape[i];

        if (cropSize > outputSize)

        {

            throw InvalidArgumentException(descriptorName + ": CropSize must be less than or equal to the uncropped"

                                           "outputSize in dimension: " + to_string(spatialDimension) + ".");

        }

    }


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void StridedSliceQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"StridedSliceQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");


    ValidateTensorQuantizationSpace(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");


    const uint32_t rank = inputTensorInfo.GetNumDimensions();

    if (rank > 4)

    {

        throw InvalidArgumentException(descriptorName + ": Input tensors with rank greater than 4 are not supported.");

    }


    // Begin, End & Stride length must be of rank(input0)

    if (m_Parameters.m_Begin.size() != rank)

    {

        throw InvalidArgumentException(descriptorName + ": Begin length must be of rank " + std::to_string(rank));

    }


    if (m_Parameters.m_End.size() != rank)

    {

        throw InvalidArgumentException(descriptorName + ": End length must be of rank " + std::to_string(rank));

    }


    if (m_Parameters.m_Stride.size() != rank)

    {

        throw InvalidArgumentException(descriptorName + ": Stride length must be of rank " + std::to_string(rank));

    }


    // Stride entries must be non-zero

    for (auto& stride : m_Parameters.m_Stride)

    {

        if (stride == 0)

        {

            throw InvalidArgumentException(descriptorName + ": Stride entries must be non-zero.");

        }

    }

}


void MinimumQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"MinimumQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 2);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo0 = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& inputTensorInfo1 = workloadInfo.m_InputTensorInfos[1];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16,

        DataType::Signed32

    };


    ValidateDataTypes(inputTensorInfo0, supportedTypes, descriptorName);

    ValidateDataTypes(inputTensorInfo1, supportedTypes, descriptorName);

    ValidateDataTypes(outputTensorInfo, supportedTypes, descriptorName);


    ValidateBroadcastTensorShapesMatch(inputTensorInfo0,

                                       inputTensorInfo1,

                                       outputTensorInfo,

                                       descriptorName,

                                       "input_0",

                                       "input_1");

}


void DebugQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"DebugQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);

}


void EqualQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"EqualQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 2);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo0 = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& inputTensorInfo1 = workloadInfo.m_InputTensorInfos[1];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateBroadcastTensorShapesMatch(inputTensorInfo0,

                                       inputTensorInfo1,

                                       outputTensorInfo,

                                       descriptorName,

                                       "input_0",

                                       "input_1");


    if (outputTensorInfo.GetDataType() != DataType::Boolean)

    {

        throw InvalidArgumentException(descriptorName + ": Output tensor type must be Boolean.");

    }

}


void GreaterQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"GreaterQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 2);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo0 = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& inputTensorInfo1 = workloadInfo.m_InputTensorInfos[1];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateBroadcastTensorShapesMatch(inputTensorInfo0,

                                       inputTensorInfo1,

                                       outputTensorInfo,

                                       descriptorName,

                                       "input_0",

                                       "input_1");


    if (outputTensorInfo.GetDataType() != DataType::Boolean)

    {

        throw InvalidArgumentException(descriptorName + ": Output tensor type must be Boolean.");

    }

}


void RsqrtQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"RsqrtQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorShapesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void GatherNdQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"GatherNdQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 2);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& indicesTensorInfo = workloadInfo.m_InputTensorInfos[1];

    if (indicesTensorInfo.GetDataType() != DataType::Signed32)

    {

        throw InvalidArgumentException(descriptorName + ": Indices tensor type must be Int32.");

    }


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

            {

                    DataType::BFloat16,

                    DataType::Float16,

                    DataType::Float32,

                    DataType::QAsymmS8,

                    DataType::QAsymmU8,

                    DataType::QSymmS16,

                    DataType::Signed32,

            };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);


    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");


    unsigned int outputDim  = outputTensorInfo.GetNumDimensions();

    ValidateTensorNumDimensions(outputTensorInfo, descriptorName, outputDim, "output");

}


void GatherQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"GatherQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 2);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& indicesTensorInfo = workloadInfo.m_InputTensorInfos[1];

    if (indicesTensorInfo.GetDataType() != DataType::Signed32)

    {

        throw InvalidArgumentException(descriptorName + ": Indices tensor type must be Int32.");

    }


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16,

        DataType::Signed32,

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);


    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");


    unsigned int outputDim  = inputTensorInfo.GetNumDimensions() + indicesTensorInfo.GetNumDimensions() - 1;

    ValidateTensorNumDimensions(outputTensorInfo, descriptorName, outputDim, "output");

}


void DetectionPostProcessQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string& descriptorName{"DetectionPostProcessQueueDescriptor"};


    ValidateNumInputs(workloadInfo, descriptorName, 2);


    if (workloadInfo.m_OutputTensorInfos.size() != 4)

    {

        throw InvalidArgumentException(descriptorName + ": Requires exactly four outputs. " +

                                       to_string(workloadInfo.m_OutputTensorInfos.size()) + " has been provided.");

    }


    if (m_Anchors == nullptr)

    {

        throw InvalidArgumentException(descriptorName + ": Anchors tensor descriptor is missing.");

    }


    const TensorInfo& boxEncodingsInfo =  workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& scoresInfo       =  workloadInfo.m_InputTensorInfos[1];

    const TensorInfo& anchorsInfo      = m_Anchors->GetTensorInfo();


    const TensorInfo& detectionBoxesInfo   = workloadInfo.m_OutputTensorInfos[0];

    const TensorInfo& detectionClassesInfo = workloadInfo.m_OutputTensorInfos[1];

    const TensorInfo& detectionScoresInfo  = workloadInfo.m_OutputTensorInfos[2];

    const TensorInfo& numDetectionsInfo    = workloadInfo.m_OutputTensorInfos[3];


    ValidateTensorNumDimensions(boxEncodingsInfo, descriptorName, 3, "box encodings");

    ValidateTensorNumDimensions(scoresInfo, descriptorName, 3, "scores");

    ValidateTensorNumDimensions(anchorsInfo, descriptorName, 2, "anchors");


    const std::vector<DataType> supportedInputTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(boxEncodingsInfo, supportedInputTypes, descriptorName);

    ValidateDataTypes(scoresInfo, supportedInputTypes, descriptorName);

    ValidateDataTypes(anchorsInfo, supportedInputTypes, descriptorName);


    ValidateTensorNumDimensions(detectionBoxesInfo, descriptorName, 3, "detection boxes");

    ValidateTensorNumDimensions(detectionScoresInfo, descriptorName, 2, "detection scores");

    ValidateTensorNumDimensions(detectionClassesInfo, descriptorName, 2, "detection classes");

    ValidateTensorNumDimensions(numDetectionsInfo, descriptorName, 1, "num detections");


    // NOTE: Output is always Float32 regardless of input type

    ValidateTensorDataType(detectionBoxesInfo, DataType::Float32, descriptorName, "detection boxes");

    ValidateTensorDataType(detectionScoresInfo, DataType::Float32, descriptorName, "detection scores");

    ValidateTensorDataType(detectionClassesInfo, DataType::Float32, descriptorName, "detection classes");

    ValidateTensorDataType(numDetectionsInfo, DataType::Float32, descriptorName, "num detections");


    if (m_Parameters.m_NmsIouThreshold <= 0.0f || m_Parameters.m_NmsIouThreshold > 1.0f)

    {

        throw InvalidArgumentException(descriptorName + ": Intersection over union threshold "

                                       "must be positive and less than or equal to 1.");

    }


    if (scoresInfo.GetShape()[2] != m_Parameters.m_NumClasses + 1)

    {

        throw InvalidArgumentException(descriptorName + ": Number of classes with background "

                                       "should be equal to number of classes + 1.");

    }

}


void DequantizeQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string& descriptorName{"DequantizeQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> inputSupportedTypes =

    {

            DataType::QAsymmS8,

            DataType::QAsymmU8,

            DataType::QSymmS8,

            DataType::QSymmS16,

            DataType::Float16

    };

    ValidateDataTypes(inputTensorInfo, inputSupportedTypes, descriptorName);


    std::vector<DataType> outputSupportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16

    };


    ValidateDataTypes(outputTensorInfo, outputSupportedTypes, descriptorName);

}


void MergeQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string& descriptorName{"MergeQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 2);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo0 = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& inputTensorInfo1 = workloadInfo.m_InputTensorInfos[1];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorShapesMatch(inputTensorInfo0, inputTensorInfo1, descriptorName, "input_0", "input_1");

    ValidateTensorShapesMatch(inputTensorInfo0, outputTensorInfo, descriptorName, "input_0", "output");


    ValidateTensorDataTypesMatch(inputTensorInfo0, inputTensorInfo1, descriptorName, "input_0", "input_1");

    ValidateTensorDataTypesMatch(inputTensorInfo0, outputTensorInfo, descriptorName, "input_0", "output");

}


void ShapeQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string& descriptorName{"ShapeQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS8,

        DataType::QSymmS16,

        DataType::Signed32

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateDataTypes(outputTensorInfo, {DataType::Signed32}, descriptorName);

}


void SwitchQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string& descriptorName{"SwitchQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 2);

    ValidateNumOutputs(workloadInfo, descriptorName, 2);


    const TensorInfo& inputTensorInfo0 = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& inputTensorInfo1 = workloadInfo.m_InputTensorInfos[1];


    const TensorInfo& outputTensorInfo0 = workloadInfo.m_OutputTensorInfos[0];

    const TensorInfo& outputTensorInfo1 = workloadInfo.m_OutputTensorInfos[1];


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo0, supportedTypes, descriptorName);

    ValidateDataTypes(inputTensorInfo1, supportedTypes, descriptorName);


    ValidateDataTypes(outputTensorInfo0, supportedTypes, descriptorName);

    ValidateDataTypes(outputTensorInfo1, supportedTypes, descriptorName);


    ValidateTensorShapesMatch(inputTensorInfo0,

                              outputTensorInfo0,

                              descriptorName,

                              "input_0",

                              "output_0");


    ValidateTensorShapesMatch(inputTensorInfo0,

                              outputTensorInfo1,

                              descriptorName,

                              "input_0",

                              "output_1");

}


void PreCompiledQueueDescriptor::Validate(const WorkloadInfo& /*workloadInfo*/) const

{

    // This is internally generated, so it should not need validation.

}


void PreluQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string& descriptorName{"PreluQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 2);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& alphaTensorInfo  = workloadInfo.m_InputTensorInfos[1];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateDataTypes(alphaTensorInfo, supportedTypes, descriptorName);


    ValidateDataTypes(outputTensorInfo, supportedTypes, descriptorName);


    ValidateTensorDataTypesMatch(inputTensorInfo, alphaTensorInfo,  descriptorName, "input", "alpha");

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "ouptut");


    ValidateBroadcastTensorShapesMatch(inputTensorInfo,

                                       alphaTensorInfo,

                                       outputTensorInfo,

                                       descriptorName,

                                       "input",

                                       "alpha");

}


void TransposeConvolution2dQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"TransposeConvolution2dQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorNumDimensions(inputTensorInfo,  descriptorName, 4, "input");

    ValidateTensorNumDimensions(outputTensorInfo, descriptorName, 4, "output");


    ValidatePointer(m_Weight, descriptorName, "weight");


    const TensorInfo& weightTensorInfo = m_Weight->GetTensorInfo();

    ValidateTensorNumDimensions(weightTensorInfo, descriptorName, 4, "weight");


    ValidateWeightDataType(inputTensorInfo, weightTensorInfo, descriptorName);


    Optional<TensorInfo> optionalBiasTensorInfo;

    if (m_Parameters.m_BiasEnabled)

    {

        ValidatePointer(m_Bias, descriptorName, "bias");


        optionalBiasTensorInfo = MakeOptional<TensorInfo>(m_Bias->GetTensorInfo());

        const TensorInfo& biasTensorInfo = optionalBiasTensorInfo.value();


        ValidateTensorDataType(biasTensorInfo, GetBiasDataType(inputTensorInfo.GetDataType()), descriptorName, "bias");

        ValidateBiasTensorQuantization(biasTensorInfo, weightTensorInfo, descriptorName);

    }


    ValidatePerAxisQuantization(inputTensorInfo,

                                outputTensorInfo,

                                weightTensorInfo,

                                optionalBiasTensorInfo,

                                descriptorName);


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void TransposeQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"TransposeQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const PermutationVector& mapping = m_Parameters.m_DimMappings;


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorNumDimensions(inputTensorInfo,  descriptorName, mapping.GetSize(), "input");

    ValidateTensorNumDimensions(outputTensorInfo, descriptorName, mapping.GetSize(), "output");


    for (unsigned int i = 0u; i < mapping.GetSize(); ++i)

    {

        if (inputTensorInfo.GetShape()[mapping[i]] != outputTensorInfo.GetShape()[i])

        {

            throw InvalidArgumentException(descriptorName + ": src dimension " + to_string(mapping[i]) +

                                           " (=" + to_string(inputTensorInfo.GetShape()[mapping[i]]) + ") " +

                                           "must match dst dimension " + to_string(i) +

                                           " (=" + to_string(outputTensorInfo.GetShape()[i]) + ")");

        }

    }


    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void ChannelShuffleQueueDescriptor::Validate(const WorkloadInfo &workloadInfo) const

{

    const std::string descriptorName{"TransposeQueueDescriptor"};


    ValidateNumInputs(workloadInfo, descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void QLstmQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"QLstmQueueDescriptor"};


    // Validate number of inputs/outputs

    ValidateNumInputs(workloadInfo,  descriptorName, 3);

    ValidateNumOutputs(workloadInfo, descriptorName, 3);


    // Input/output tensor info

    auto inputInfo = workloadInfo.m_InputTensorInfos[0];

    auto outputStateInInfo = workloadInfo.m_InputTensorInfos[1];

    auto cellStateInInfo = workloadInfo.m_InputTensorInfos[2];


    auto outputStateOutInfo = workloadInfo.m_OutputTensorInfos[0];

    auto cellStateOutInfo = workloadInfo.m_OutputTensorInfos[1];

    auto outputInfo = workloadInfo.m_OutputTensorInfos[2];


    // Supported types for various tensors in QLSTM

    std::vector<DataType> inputOutputSupportedTypes =

    {

        DataType::QAsymmS8

    };


    std::vector<DataType> cellStateSupportedTypes =

    {

        DataType::QSymmS16

    };


    std::vector<DataType> weightsSupportedTypes =

    {

        DataType::QSymmS8

    };


    std::vector<DataType> layerNormPeepholeWeightsSupportedTypes =

    {

        DataType::QSymmS16

    };


    std::vector<DataType> biasSupportedTypes =

    {

        DataType::Signed32

    };


    // Validate types of input/output tensors

    ValidateDataTypes(inputInfo, inputOutputSupportedTypes, descriptorName);

    ValidateDataTypes(outputStateInInfo, inputOutputSupportedTypes, descriptorName);

    ValidateDataTypes(cellStateInInfo, cellStateSupportedTypes, descriptorName);


    ValidateDataTypes(outputStateOutInfo, inputOutputSupportedTypes, descriptorName);

    ValidateDataTypes(cellStateOutInfo, cellStateSupportedTypes, descriptorName);

    ValidateDataTypes(outputInfo, inputOutputSupportedTypes, descriptorName);


    // Validate matching types of input/output tensors

    ValidateTensorDataTypesMatch(inputInfo, outputStateInInfo, descriptorName, "input", "outputStateIn");

    ValidateTensorDataTypesMatch(outputStateInInfo, outputStateOutInfo, descriptorName,

                                 "outputStateIn", "outputStateOut");

    ValidateTensorDataTypesMatch(cellStateInInfo, cellStateOutInfo, descriptorName, "cellStateIn", "cellStateOut");


    // Infer number of batches, number of units, input size and output size from tensor dimensions

    const uint32_t numBatches = inputInfo.GetShape()[0];

    const uint32_t inputSize  = inputInfo.GetShape()[1];

    const uint32_t outputSize = outputStateInInfo.GetShape()[1];

    const uint32_t numUnits = cellStateInInfo.GetShape()[1];


    // Validate number of dimensions and number of elements for input/output tensors

    ValidateTensorNumDimNumElem(inputInfo, 2, (numBatches * inputSize), descriptorName + " input");

    ValidateTensorNumDimNumElem(outputStateInInfo, 2, (numBatches * outputSize), descriptorName + " outputStateIn");

    ValidateTensorNumDimNumElem(cellStateInInfo, 2, (numBatches * numUnits), descriptorName + " cellStateIn");


    ValidateTensorNumDimNumElem(outputStateOutInfo, 2, (numBatches * outputSize), descriptorName + " outputStateOut");

    ValidateTensorNumDimNumElem(cellStateOutInfo, 2, (numBatches * numUnits), descriptorName + " cellStateOut");

    ValidateTensorNumDimNumElem(outputInfo, 2, (numBatches * outputSize), descriptorName + " output");


    // Validate number of dimensions and number of elements for MANDATORY weight tensors

    ValidatePointer(m_InputToForgetWeights, descriptorName, "InputToForgetWeights");

    auto inputToForgetWeightsInfo = m_InputToForgetWeights->GetTensorInfo();

    ValidateTensorNumDimNumElem(inputToForgetWeightsInfo, 2, (numUnits * inputSize), " InputToForgetWeights");


    ValidatePointer(m_InputToCellWeights, descriptorName, "InputToCellWeights");

    auto inputToCellWeightsInfo = m_InputToCellWeights->GetTensorInfo();

    ValidateTensorNumDimNumElem(inputToCellWeightsInfo, 2, (numUnits * inputSize), " InputToCellWeights");


    ValidatePointer(m_InputToOutputWeights, descriptorName, "InputToOutputWeights");

    auto inputToOutputWeightsInfo = m_InputToOutputWeights->GetTensorInfo();

    ValidateTensorNumDimNumElem(inputToOutputWeightsInfo, 2, (numUnits * inputSize), " InputToOutputWeights");


    ValidatePointer(m_RecurrentToForgetWeights, descriptorName, "RecurrentToForgetWeights");

    auto recurrentToForgetWeightsInfo = m_RecurrentToForgetWeights->GetTensorInfo();

    ValidateTensorNumDimNumElem(recurrentToForgetWeightsInfo, 2, (numUnits * outputSize),

                                " RecurrentToForgetWeights");


    ValidatePointer(m_RecurrentToCellWeights, descriptorName, "RecurrentToCellWeights");

    auto recurrentToCellWeightsInfo = m_RecurrentToCellWeights->GetTensorInfo();

    ValidateTensorNumDimNumElem(recurrentToCellWeightsInfo, 2, (numUnits * outputSize), " RecurrentToCellWeights");


    ValidatePointer(m_RecurrentToOutputWeights, descriptorName, "RecurrentToOutputWeights");

    auto recurrentToOutputWeightsInfo = m_RecurrentToOutputWeights->GetTensorInfo();

    ValidateTensorNumDimNumElem(recurrentToOutputWeightsInfo, 2, (numUnits * outputSize), " RecurrentToCellWeights");


    // Validate data types for MANDATORY weights tensors (all should match each other)

    ValidateDataTypes(inputToForgetWeightsInfo, weightsSupportedTypes, descriptorName);


    ValidateTensorDataTypesMatch(inputToForgetWeightsInfo, inputToCellWeightsInfo, descriptorName,

                                 "inputToForgetWeights", "inputToCellWeights");

    ValidateTensorDataTypesMatch(inputToForgetWeightsInfo, inputToOutputWeightsInfo, descriptorName,

                                 "inputToForgetWeights", "inputToOutputWeights");


    ValidateTensorDataTypesMatch(inputToForgetWeightsInfo, recurrentToForgetWeightsInfo, descriptorName,

                                 "inputToForgetWeights", "recurrentToForgeteights");

    ValidateTensorDataTypesMatch(inputToForgetWeightsInfo, recurrentToCellWeightsInfo, descriptorName,

                                 "inputToForgetWeights", "recurrentToCellWeights");

    ValidateTensorDataTypesMatch(inputToForgetWeightsInfo, recurrentToOutputWeightsInfo, descriptorName,

                                 "inputToForgetWeights", "recurrentToOutputWeights");


    // Validate number of dimensions and number of elements for MANDATORY bias tensors

    ValidatePointer(m_ForgetGateBias, descriptorName, "ForgetGateBias");

    auto forgetGateBiasInfo = m_ForgetGateBias->GetTensorInfo();

    ValidateTensorNumDimNumElem(forgetGateBiasInfo, 1, numUnits, " ForgetGateBias");


    ValidatePointer(m_CellBias, descriptorName, "CellBias");

    auto cellBiasInfo = m_CellBias->GetTensorInfo();

    ValidateTensorNumDimNumElem(cellBiasInfo, 1, numUnits, " CellBias");


    ValidatePointer(m_OutputGateBias, descriptorName, "OutputGateBias");

    auto outputGateBiasInfo = m_OutputGateBias->GetTensorInfo();

    ValidateTensorNumDimNumElem(outputGateBiasInfo, 1, numUnits, " OutputGateBias");


    // Validate data types for MANDATORY bias tensors

    ValidateDataTypes(forgetGateBiasInfo, biasSupportedTypes, descriptorName);


    ValidateTensorDataTypesMatch(forgetGateBiasInfo, cellBiasInfo, descriptorName,

                                 "forgetGateBias", "cellBias");

    ValidateTensorDataTypesMatch(forgetGateBiasInfo, outputGateBiasInfo, descriptorName,

                                 "forgetGateBias", "outputGateBias");


    // Validate OPTIONAL params: CIFG (inputToInputWeights, recurrentToInputWeights, inputGateBias)

    const bool allCifgParamsPresentOrNot = ((m_InputToInputWeights && m_RecurrentToInputWeights && m_InputGateBias &&

                                             !m_Parameters.m_CifgEnabled) ||

                                            (!m_InputToInputWeights && !m_RecurrentToInputWeights &&

                                             !m_InputGateBias && m_Parameters.m_CifgEnabled));


    if (!allCifgParamsPresentOrNot)

    {

        throw InvalidArgumentException(descriptorName +

                ": InputToInputWeights, RecurrentToInputWeights and InputGateBias must either all be present "

                "(CIFG disabled) or not be present at all (CIFG enabled). m_Parameters.m_CifgEnabled should be "

                "set appropriately.");

    }


    if (!m_Parameters.m_CifgEnabled)

    {

        // Validate number of dimensions and number of elements

        auto inputToInputWeightsInfo = m_InputToInputWeights->GetTensorInfo();

        ValidateTensorNumDimNumElem(inputToInputWeightsInfo, 2, (numUnits * inputSize), " InputToInputWeights");


        auto recurrentToInputWeightsInfo = m_RecurrentToInputWeights->GetTensorInfo();

        ValidateTensorNumDimNumElem(recurrentToInputWeightsInfo, 2, (numUnits * outputSize),

                                    " RecurrentToInputWeights");


        auto inputGateBiasInfo = m_InputGateBias->GetTensorInfo();

        ValidateTensorNumDimNumElem(inputGateBiasInfo, 1, numUnits, " InputGateBias");


        // Validate data types

        ValidateTensorDataTypesMatch(inputToForgetWeightsInfo, inputToInputWeightsInfo, descriptorName,

                                     "inputToForgetWeights", "inputToInputWeights");

        ValidateTensorDataTypesMatch(inputToForgetWeightsInfo, recurrentToInputWeightsInfo, descriptorName,

                                     "inputToForgetWeights", "recurrentToInputWeights");

        ValidateTensorDataTypesMatch(forgetGateBiasInfo, inputGateBiasInfo, descriptorName,

                                     "forgetGateBias", "inputGateBias");

    }


    // Validate OPTIONAL params: Peephole (cellToInputWeights, cellToForgetWeights, cellToOutputWeights)

    bool allPeepholeWeightsPresentOrNot =

            (((m_CellToInputWeights || m_Parameters.m_CifgEnabled) && m_CellToForgetWeights

              && m_CellToOutputWeights && m_Parameters.m_PeepholeEnabled)

             || (!m_CellToInputWeights && !m_CellToForgetWeights

                 && !m_CellToOutputWeights && !m_Parameters.m_PeepholeEnabled));


    if (!allPeepholeWeightsPresentOrNot)

    {

        throw InvalidArgumentException(descriptorName +

                ": CellToInputWeights, CellToForgetWeights and CellToOutputWeights should all be present (Peephole "

                "enabled) or not be present at all (Peephole disabled). CellToInputWeights should only be present "

                "when Peephole is enabled and CIFG is disabled. m_Parameters.m_PeepholeEnabled should be set "

                "appropriately.");

    }


    if (m_Parameters.m_PeepholeEnabled)

    {

        auto cellToForgetWeightsInfo = m_CellToForgetWeights->GetTensorInfo();

        ValidateTensorNumDimNumElem(cellToForgetWeightsInfo, 1, numUnits, " cellToForgetWeights");

        ValidateDataTypes(cellToForgetWeightsInfo, layerNormPeepholeWeightsSupportedTypes, descriptorName);


        auto cellToOutputWeightsInfo = m_CellToOutputWeights->GetTensorInfo();

        ValidateTensorNumDimNumElem(cellToOutputWeightsInfo, 1, numUnits, " cellToOutputWeights");

        ValidateTensorDataTypesMatch(cellToForgetWeightsInfo, cellToOutputWeightsInfo, descriptorName,

                                     "cellToForgetWeight", "cellToOutputWeights");


        if (!m_Parameters.m_CifgEnabled)

        {

            auto cellToInputWeightsInfo = m_CellToInputWeights->GetTensorInfo();

            ValidateTensorNumDimNumElem(cellToInputWeightsInfo, 1, numUnits, " cellToInputWeights");

            ValidateTensorDataTypesMatch(cellToForgetWeightsInfo, cellToInputWeightsInfo, descriptorName,

                                         "cellToForgetWeights", "cellToInputWeights");

        }

    }


    // Validate OPTIONAL params: Layer Norm Weights

    bool allLayerNormWeightsPresentOrNot =

            (((m_InputLayerNormWeights || m_Parameters.m_CifgEnabled) && m_ForgetLayerNormWeights

              && m_CellLayerNormWeights && m_OutputLayerNormWeights && m_Parameters.m_LayerNormEnabled)

             || (!m_InputLayerNormWeights && !m_ForgetLayerNormWeights && !m_CellLayerNormWeights

                 && !m_OutputLayerNormWeights && !m_Parameters.m_LayerNormEnabled));


    if (!allLayerNormWeightsPresentOrNot)

    {

        throw InvalidArgumentException(descriptorName +

                                       ": InputLayerNormWeights, ForgetLayerNormWeights, m_OutputLayerNormWeights "

                                       "and CellLayerNormWeights should all be present (Layer Norm enabled) or not "

                                       "be present at all (Layer Norm disabled). InputLayerNormWeights should "

                                       "only be present when Layer Norm is enabled and CIFG is disabled. "

                                       "m_Parameters.m_LayerNormEnabled should be set appropriately.");

    }


    if (m_Parameters.m_LayerNormEnabled)

    {

        auto forgetLayerNormWeightsInfo = m_ForgetLayerNormWeights->GetTensorInfo();

        ValidateTensorNumDimNumElem(forgetLayerNormWeightsInfo, 1, numUnits, " forgetLayerNormWeights");

        ValidateDataTypes(forgetLayerNormWeightsInfo, layerNormPeepholeWeightsSupportedTypes, descriptorName);


        auto cellLayerNormWeightsInfo = m_CellLayerNormWeights->GetTensorInfo();

        ValidateTensorNumDimNumElem(cellLayerNormWeightsInfo, 1, numUnits, " cellLayerNormWeights");

        ValidateTensorDataTypesMatch(forgetLayerNormWeightsInfo, cellLayerNormWeightsInfo, descriptorName,

                                     "forgetLayerNormWeights", "cellLayerNormWeights");


        auto outputLayerNormWeightsInfo = m_OutputLayerNormWeights->GetTensorInfo();

        ValidateTensorNumDimNumElem(outputLayerNormWeightsInfo, 1, numUnits, " outputLayerNormWeights");

        ValidateTensorDataTypesMatch(forgetLayerNormWeightsInfo, outputLayerNormWeightsInfo, descriptorName,

                                     "forgetLayerNormWeights", "outputLayerNormWeights");


        if (!m_Parameters.m_CifgEnabled)

        {

            auto inputLayerNormWeightsInfo = m_InputLayerNormWeights->GetTensorInfo();

            ValidateTensorNumDimNumElem(inputLayerNormWeightsInfo, 1, numUnits, " inputLayerNormWeights");

            ValidateTensorDataTypesMatch(forgetLayerNormWeightsInfo, inputLayerNormWeightsInfo, descriptorName,

                                         "forgetLayerNormWeights", "inputLayerNormWeights");

        }

    }


    // Validate OPTIONAL params: Projection (projectionWeights, projectionBias)

    bool correctProjectionTensorsPresent =

            ((!m_ProjectionWeights && !m_ProjectionBias && !m_Parameters.m_ProjectionEnabled) ||

            (m_ProjectionWeights && !m_ProjectionBias && m_Parameters.m_ProjectionEnabled) ||

            (m_ProjectionWeights && m_ProjectionBias && m_Parameters.m_ProjectionEnabled));


    if (!correctProjectionTensorsPresent)

    {

        throw InvalidArgumentException(descriptorName +

                                       ": If projection is enabled, ProjectionWeights should be present and "

                                       "ProjectionBias is optional. If projection is disabled, neither "

                                       "ProjectionWeights nor ProjectionBias should be present.");

    }


    if (m_Parameters.m_ProjectionEnabled)

    {

        auto projectionWeightsInfo = m_ProjectionWeights->GetTensorInfo();

        ValidateTensorNumDimNumElem(projectionWeightsInfo, 2, (numUnits * outputSize), "ProjectionWeights");

        ValidateDataTypes(projectionWeightsInfo, weightsSupportedTypes, descriptorName);


        if (m_ProjectionBias)

        {

            auto projectionBiasInfo = m_ProjectionBias->GetTensorInfo();

            ValidateTensorNumDimNumElem(projectionBiasInfo, 1, outputSize, "ProjectionBias");

            ValidateDataTypes(projectionBiasInfo, biasSupportedTypes, descriptorName);

        }


    }

    else if ((outputInfo.GetQuantizationScale() != m_Parameters.m_HiddenStateScale) &&

              outputInfo.GetQuantizationOffset() != m_Parameters.m_HiddenStateZeroPoint) {

        throw InvalidArgumentException(descriptorName +

                                       ": If projection is disabled, output quantization info (scale, offset) "

                                       "should match HiddenStateScale and HiddenStateZeroPoint.");

    }


}


void QuantizedLstmQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"QuantizedLstmQueueDescriptor"};


    // Validate number of inputs/outputs

    ValidateNumInputs(workloadInfo,  descriptorName, 3);

    ValidateNumOutputs(workloadInfo, descriptorName, 2);


    // Input/output tensor infos

    auto inputInfo = workloadInfo.m_InputTensorInfos[0];

    auto cellStateInInfo = workloadInfo.m_InputTensorInfos[1];

    auto outputStateInInfo = workloadInfo.m_InputTensorInfos[2];


    auto cellStateOutInfo = workloadInfo.m_OutputTensorInfos[0];

    auto outputStateOutInfo = workloadInfo.m_OutputTensorInfos[1];


    std::vector<DataType> inputOutputSupportedTypes =

    {

        DataType::QAsymmU8

    };


    std::vector<DataType> cellStateSupportedTypes =

    {

        DataType::QSymmS16

    };


    std::vector<DataType> weightsSupportedTypes =

    {

        DataType::QAsymmU8

    };


    std::vector<DataType> biasSupportedTypes =

    {

        DataType::Signed32

    };


    // Validate types of input/output tensors

    ValidateDataTypes(inputInfo, inputOutputSupportedTypes, descriptorName);

    ValidateDataTypes(cellStateInInfo, cellStateSupportedTypes, descriptorName);

    ValidateDataTypes(outputStateInInfo, inputOutputSupportedTypes, descriptorName);


    ValidateDataTypes(cellStateOutInfo, cellStateSupportedTypes, descriptorName);

    ValidateDataTypes(outputStateOutInfo, inputOutputSupportedTypes, descriptorName);


    // Validate matching types of input/output tensors

    ValidateTensorDataTypesMatch(inputInfo, outputStateInInfo, descriptorName, "input", "outputStateIn");

    ValidateTensorDataTypesMatch(outputStateInInfo, outputStateOutInfo, descriptorName,

                                 "outputStateIn", "outputStateOut");

    ValidateTensorDataTypesMatch(cellStateInInfo, cellStateOutInfo, descriptorName, "cellStateIn", "cellStateOut");


    // Validate matching quantization info for input/output tensors

    ValidateTensorQuantizationSpace(inputInfo, outputStateInInfo, descriptorName, "input", "outputStateIn");

    ValidateTensorQuantizationSpace(inputInfo, outputStateOutInfo, descriptorName, "input", "outputStateOut");

    ValidateTensorQuantizationSpace(cellStateInInfo, cellStateOutInfo, descriptorName, "cellStateIn", "cellStateOut");


    // Infer number of batches, input size and output size from tensor dimensions

    const uint32_t numBatches = inputInfo.GetShape()[0];

    const uint32_t inputSize  = inputInfo.GetShape()[1];

    const uint32_t outputSize = cellStateInInfo.GetShape()[1];


    // Validate number of dimensions and number of elements for input/output tensors

    ValidateTensorNumDimNumElem(inputInfo, 2, (numBatches * inputSize), descriptorName + " input");

    ValidateTensorNumDimNumElem(cellStateInInfo, 2, (numBatches * outputSize), descriptorName + " cellStateIn");

    ValidateTensorNumDimNumElem(outputStateInInfo, 2, (numBatches * outputSize), descriptorName + " outputStateIn");

    ValidateTensorNumDimNumElem(cellStateOutInfo, 2, (numBatches * outputSize), descriptorName + " cellStateOut");

    ValidateTensorNumDimNumElem(outputStateOutInfo, 2, (numBatches * outputSize), descriptorName + " outputStateOut");


    // Validate number of dimensions and number of elements for weights tensors

    ValidatePointer(m_InputToInputWeights, descriptorName, "InputToInputWeights");

    auto inputToInputWeightsInfo = m_InputToInputWeights->GetTensorInfo();

    ValidateTensorNumDimNumElem(inputToInputWeightsInfo, 2, (outputSize * inputSize), " InputToInputWeights");


    ValidatePointer(m_InputToForgetWeights, descriptorName, "InputToForgetWeights");

    auto inputToForgetWeightsInfo = m_InputToForgetWeights->GetTensorInfo();

    ValidateTensorNumDimNumElem(inputToForgetWeightsInfo, 2, (outputSize * inputSize), " InputToForgetWeights");


    ValidatePointer(m_InputToCellWeights, descriptorName, "InputToCellWeights");

    auto inputToCellWeightsInfo = m_InputToCellWeights->GetTensorInfo();

    ValidateTensorNumDimNumElem(inputToCellWeightsInfo, 2, (outputSize * inputSize), " InputToCellWeights");


    ValidatePointer(m_InputToOutputWeights, descriptorName, "InputToOutputWeights");

    auto inputToOutputWeightsInfo = m_InputToOutputWeights->GetTensorInfo();

    ValidateTensorNumDimNumElem(inputToOutputWeightsInfo, 2, (outputSize * inputSize), " InputToOutputWeights");


    ValidatePointer(m_RecurrentToInputWeights, descriptorName, "RecurrentToInputWeights");

    auto recurrentToInputWeightsInfo = m_RecurrentToInputWeights->GetTensorInfo();

    ValidateTensorNumDimNumElem(recurrentToInputWeightsInfo, 2, (outputSize * outputSize), " RecurrentToInputWeights");


    ValidatePointer(m_RecurrentToForgetWeights, descriptorName, "RecurrentToForgetWeights");

    auto recurrentToForgetWeightsInfo = m_RecurrentToForgetWeights->GetTensorInfo();

    ValidateTensorNumDimNumElem(recurrentToForgetWeightsInfo, 2, (outputSize * outputSize),

                                " RecurrentToForgetWeights");


    ValidatePointer(m_RecurrentToCellWeights, descriptorName, "RecurrentToCellWeights");

    auto recurrentToCellWeightsInfo = m_RecurrentToCellWeights->GetTensorInfo();

    ValidateTensorNumDimNumElem(recurrentToCellWeightsInfo, 2, (outputSize * outputSize), " RecurrentToCellWeights");


    ValidatePointer(m_RecurrentToOutputWeights, descriptorName, "RecurrentToOutputWeights");

    auto recurrentToOutputWeightsInfo = m_RecurrentToOutputWeights->GetTensorInfo();

    ValidateTensorNumDimNumElem(recurrentToOutputWeightsInfo, 2, (outputSize * outputSize), " RecurrentToCellWeights");


    // Validate data types for weights tensors (all should match each other)

    ValidateDataTypes(inputToInputWeightsInfo, weightsSupportedTypes, descriptorName);


    ValidateTensorDataTypesMatch(inputToInputWeightsInfo, inputToForgetWeightsInfo, descriptorName,

                                 "inputToInputWeights", "inputToForgetWeights");

    ValidateTensorDataTypesMatch(inputToInputWeightsInfo, inputToCellWeightsInfo, descriptorName,

                                 "inputToInputWeights", "inputToCellWeights");

    ValidateTensorDataTypesMatch(inputToInputWeightsInfo, inputToOutputWeightsInfo, descriptorName,

                                 "inputToInputWeights", "inputToOutputWeights");


    ValidateTensorDataTypesMatch(inputToInputWeightsInfo, recurrentToInputWeightsInfo, descriptorName,

                                 "inputToInputWeights", "recurrentToInputWeights");

    ValidateTensorDataTypesMatch(inputToInputWeightsInfo, recurrentToForgetWeightsInfo, descriptorName,

                                 "inputToInputWeights", "recurrentToForgeteights");

    ValidateTensorDataTypesMatch(inputToInputWeightsInfo, recurrentToCellWeightsInfo, descriptorName,

                                 "inputToInputWeights", "recurrentToCellWeights");

    ValidateTensorDataTypesMatch(inputToInputWeightsInfo, recurrentToOutputWeightsInfo, descriptorName,

                                 "inputToInputWeights", "recurrentToOutputWeights");


    // Validate matching quantization info for weight tensors (all should match each other)

    ValidateTensorQuantizationSpace(inputToInputWeightsInfo, inputToForgetWeightsInfo,

                                    descriptorName, "inputToInputWeights", "inputToForgetWeights");

    ValidateTensorQuantizationSpace(inputToInputWeightsInfo, inputToCellWeightsInfo,

                                    descriptorName, "inputToInputWeights", "inputToCellWeights");

    ValidateTensorQuantizationSpace(inputToInputWeightsInfo, inputToOutputWeightsInfo,

                                    descriptorName, "inputToInputWeights", "inputToOutputWeights");


    ValidateTensorQuantizationSpace(inputToInputWeightsInfo, recurrentToInputWeightsInfo,

                                    descriptorName, "inputToInputWeights", "recurrentToInputWeights");

    ValidateTensorQuantizationSpace(inputToInputWeightsInfo, recurrentToForgetWeightsInfo,

                                    descriptorName, "inputToInputWeights", "recurrentToForgetWeights");

    ValidateTensorQuantizationSpace(inputToInputWeightsInfo, recurrentToCellWeightsInfo,

                                    descriptorName, "inputToInputWeights", "recurrentToCellWeights");

    ValidateTensorQuantizationSpace(inputToInputWeightsInfo, recurrentToOutputWeightsInfo,

                                    descriptorName, "inputToInputWeights", "recurrentToOutputWeights");


    // Validate number of dimensions and number of elements in bias tensors

    ValidatePointer(m_InputGateBias, descriptorName, "InputGateBias");

    auto inputGateBiasInfo = m_InputGateBias->GetTensorInfo();

    ValidateTensorNumDimNumElem(inputGateBiasInfo, 1, outputSize, " InputGateBias");


    ValidatePointer(m_ForgetGateBias, descriptorName, "ForgetGateBias");

    auto forgetGateBiasInfo = m_ForgetGateBias->GetTensorInfo();

    ValidateTensorNumDimNumElem(forgetGateBiasInfo, 1, outputSize, " ForgetGateBias");


    ValidatePointer(m_CellBias, descriptorName, "CellBias");

    auto cellBiasInfo = m_CellBias->GetTensorInfo();

    ValidateTensorNumDimNumElem(cellBiasInfo, 1, outputSize, " CellBias");


    ValidatePointer(m_OutputGateBias, descriptorName, "OutputGateBias");

    auto outputGateBiasInfo = m_OutputGateBias->GetTensorInfo();

    ValidateTensorNumDimNumElem(outputGateBiasInfo, 1, outputSize, " OutputGateBias");


    // Validate data types for bias tensors (all should match each other)

    ValidateDataTypes(inputGateBiasInfo, biasSupportedTypes, descriptorName);


    ValidateTensorDataTypesMatch(inputGateBiasInfo, forgetGateBiasInfo, descriptorName,

                                 "inputGateBias", "forgetGateBias");

    ValidateTensorDataTypesMatch(inputGateBiasInfo, cellBiasInfo, descriptorName,

                                 "inputGateBias", "cellBias");

    ValidateTensorDataTypesMatch(inputGateBiasInfo, outputGateBiasInfo, descriptorName,

                                 "inputGateBias", "outputGateBias");


    // Validate bias tensor quantization info

    ValidateBiasTensorQuantization(inputGateBiasInfo, inputToInputWeightsInfo, descriptorName);

    ValidateBiasTensorQuantization(forgetGateBiasInfo, inputToInputWeightsInfo, descriptorName);

    ValidateBiasTensorQuantization(cellBiasInfo, inputToInputWeightsInfo, descriptorName);

    ValidateBiasTensorQuantization(outputGateBiasInfo, inputToInputWeightsInfo, descriptorName);

}


void AbsQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"AbsQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorShapesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16,

        DataType::Signed32

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void SliceQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"SliceQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");


    const unsigned int rank = inputTensorInfo.GetNumDimensions();

    if (rank > 4)

    {

        throw InvalidArgumentException(descriptorName + ": Input tensors with rank greater than 4 are not supported.");

    }


    ValidateTensorNumDimensions(outputTensorInfo, descriptorName, rank, "output");


    // Check if m_Begin and m_Size have the expected length

    if (m_Parameters.m_Begin.size() != rank)

    {

        throw InvalidArgumentException(descriptorName +

            ": Length of begin offset descriptor must equal rank " + std::to_string(rank));

    }

    if (m_Parameters.m_Size.size() != rank)

    {

        throw InvalidArgumentException(descriptorName +

            ": Length of size descriptor must equal rank " + std::to_string(rank));

    }


    // Check if the shape of the output tensor matches m_Size

    const TensorShape& outputShape = outputTensorInfo.GetShape();

    for (unsigned int i = 0u; i < rank; ++i)

    {

        if (m_Parameters.m_Size[i] != outputShape[i])

        {

            throw InvalidArgumentException(descriptorName + ": Size descriptor does not match output tensor.");

        }

    }


    // Check if the sum of begin offset and size in a given dimension

    // does not exceed the size of corresponding input

    const TensorShape& inputShape  = inputTensorInfo.GetShape();

    for(unsigned int i = 0u; i < rank; ++i)

    {

        if (m_Parameters.m_Begin[i] + m_Parameters.m_Size[i] > inputShape[i])

        {

            throw InvalidArgumentException(descriptorName + ": Sum of begin offset and size for dimension " +

                std::to_string(i) + " exceeds input size.");

        }

    }

}


void DepthToSpaceQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"DepthToSpaceQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorNumDimensions(inputInfo,  descriptorName, 4, "input");

    ValidateTensorNumDimensions(outputInfo, descriptorName, 4, "output");


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float32,

        DataType::Float16,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputInfo,  supportedTypes, descriptorName);

    ValidateDataTypes(outputInfo, supportedTypes, descriptorName);


    ValidateTensorNumElementsMatch(inputInfo, outputInfo, descriptorName, "input", "output");


    if (m_Parameters.m_BlockSize == 0)

    {

        throw InvalidArgumentException(descriptorName + ": Block size cannot be 0.");

    }


    DataLayoutIndexed dimensionIndices(m_Parameters.m_DataLayout);

    const unsigned int wIndex = dimensionIndices.GetWidthIndex();

    const unsigned int hIndex = dimensionIndices.GetHeightIndex();

    const unsigned int cIndex = dimensionIndices.GetChannelsIndex();


    const TensorShape& outputShape = outputInfo.GetShape();

    if (outputShape[hIndex] % m_Parameters.m_BlockSize != 0 || outputShape[wIndex]  % m_Parameters.m_BlockSize != 0)

    {

        throw InvalidArgumentException(descriptorName + ": Output width and height shape"

                                       "must be divisible by block size.");

    }


    const TensorShape& inputShape = inputInfo.GetShape();

    if (inputShape[cIndex] % (m_Parameters.m_BlockSize * m_Parameters.m_BlockSize) != 0)

    {

        throw InvalidArgumentException(descriptorName + ": The depth of the input tensor"

                                       "must be divisible by the square of block size." );

    }

}


void ComparisonQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"ComparisonQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 2);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo0 = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& inputTensorInfo1 = workloadInfo.m_InputTensorInfos[1];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateBroadcastTensorShapesMatch(inputTensorInfo0,

                                       inputTensorInfo1,

                                       outputTensorInfo,

                                       descriptorName,

                                       "input_0",

                                       "input_1");


    if (outputTensorInfo.GetDataType() != DataType::Boolean)

    {

        throw InvalidArgumentException(descriptorName + ": Output tensor type must be Boolean.");

    }

}


void ElementwiseBinaryQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"ElementwiseBinaryQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 2);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo0 = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& inputTensorInfo1 = workloadInfo.m_InputTensorInfos[1];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

            {

                    DataType::BFloat16,

                    DataType::Float16,

                    DataType::Float32,

                    DataType::QAsymmS8,

                    DataType::QAsymmU8,

                    DataType::QSymmS16,

                    DataType::Signed32

            };


    ValidateDataTypes(inputTensorInfo0, supportedTypes, descriptorName);

    ValidateDataTypes(inputTensorInfo1, supportedTypes, descriptorName);


    ValidateTensorDataTypesMatch(inputTensorInfo0, outputTensorInfo, descriptorName, "input", "output");

    ValidateTensorDataTypesMatch(inputTensorInfo1, outputTensorInfo, descriptorName, "input", "output");

}


void ElementwiseUnaryQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"ElementwiseUnaryQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorShapesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16,

        DataType::Signed32

    };


    std::vector<DataType> logicalSupportedTypes =

    {

        DataType::Boolean

    };


    if (m_Parameters.m_Operation == UnaryOperation::LogicalNot)

    {

        ValidateDataTypes(inputTensorInfo, logicalSupportedTypes, descriptorName);

    }

    else

    {

        ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    }


    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void RankQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"RankQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateTensorNumDimensions(outputTensorInfo, descriptorName, 1, "output");

    ValidateTensorNumElements(outputTensorInfo, descriptorName, 1, "output");


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS8,

        DataType::QSymmS16,

        DataType::Signed32

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateDataTypes(outputTensorInfo, { DataType::Signed32 }, descriptorName);

}


void LogicalBinaryQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"LogicalBinaryQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 2);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo0 = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& inputTensorInfo1 = workloadInfo.m_InputTensorInfos[1];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    ValidateBroadcastTensorShapesMatch(inputTensorInfo0,

                                       inputTensorInfo1,

                                       outputTensorInfo,

                                       descriptorName,

                                       "input_0",

                                       "input_1");


    if (inputTensorInfo0.GetDataType() != DataType::Boolean)

    {

        throw InvalidArgumentException(descriptorName + ": Input tensor 0 type must be Boolean.");

    }


    if (inputTensorInfo1.GetDataType() != DataType::Boolean)

    {

        throw InvalidArgumentException(descriptorName + ": Input tensor 1 type must be Boolean.");

    }


    if (outputTensorInfo.GetDataType() != DataType::Boolean)

    {

        throw InvalidArgumentException(descriptorName + ": Output tensor type must be Boolean.");

    }

}


void ReduceQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"ReduceQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo  = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16,

        DataType::Signed32

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateTensorDataTypesMatch(inputTensorInfo, outputTensorInfo, descriptorName, "input", "output");

}


void UnidirectionalSequenceLstmQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    // Modified from LstmQueueDescriptor::Validate to support UnidirectionalSequenceLstm


    const std::string descriptorName{"UnidirectionalSequenceLstmQueueDescriptor"};


    // check dimensions of all inputs and outputs

    if (workloadInfo.m_InputTensorInfos.size() != 3)

    {

        throw InvalidArgumentException(descriptorName + ": Invalid number of inputs.");

    }

    if (workloadInfo.m_OutputTensorInfos.size() != 3)

    {

        throw InvalidArgumentException(descriptorName + ": Invalid number of outputs.");

    }


    std::vector<DataType> supportedTypes =

    {

        DataType::Float32,

        DataType::QAsymmS8

    };


    // check for supported type of one input and match them with all the other input and output

    ValidateDataTypes(workloadInfo.m_InputTensorInfos[0], supportedTypes, descriptorName);


    // Making sure clipping parameters have valid values.

    // == 0 means no clipping

    //  > 0 means clipping

    if (m_Parameters.m_ClippingThresCell < 0.0f)

    {

        throw InvalidArgumentException(descriptorName + ": negative cell clipping threshold is invalid");

    }

    if (m_Parameters.m_ClippingThresProj < 0.0f)

    {

        throw InvalidArgumentException(descriptorName + ": negative projection clipping threshold is invalid");

    }


    unsigned int batchIndx = 0;

    unsigned int inputIndx = 1;

    uint32_t timeStep = 1;

    unsigned int timeIndx = 1;

    inputIndx = 2;

    if (m_Parameters.m_TimeMajor)

    {

        batchIndx = 1;

        timeIndx = 0;


    }

    timeStep = workloadInfo.m_InputTensorInfos[0].GetShape()[timeIndx];


    // Inferring batch size, number of outputs and number of cells from the inputs.

    const uint32_t n_input = workloadInfo.m_InputTensorInfos[0].GetShape()[inputIndx];

    const uint32_t n_batch = workloadInfo.m_InputTensorInfos[0].GetShape()[batchIndx];

    ValidatePointer(m_InputToOutputWeights, "Null pointer check", "InputToOutputWeights");

    const uint32_t n_cell = m_InputToOutputWeights->GetShape()[0];

    ValidatePointer(m_RecurrentToOutputWeights, "Null pointer check", "RecurrentToOutputWeights");

    const uint32_t n_output = m_RecurrentToOutputWeights->GetShape()[1];


    // input tensor

    ValidateTensorNumDimNumElem(workloadInfo.m_InputTensorInfos[0], 3, (timeStep * n_batch * n_input),

                                descriptorName + " input_0");

    // outputStateInTensor

    ValidateTensorNumDimNumElem(workloadInfo.m_InputTensorInfos[1], 2, (n_batch * n_output),

                                descriptorName + " input_1");

    // outputStateInTensor

    ValidateTensorNumDimNumElem(workloadInfo.m_InputTensorInfos[2], 2, (n_batch * n_cell),

                                descriptorName + " input_2");


    // outputTensor

    ValidateTensorNumDimNumElem(workloadInfo.m_OutputTensorInfos[2], 3, (timeStep * n_batch * n_output),

                                descriptorName + " output_0");


    // check that dimensions of inputs/outputs and QueueDescriptor data match with each other

    if ( m_InputToInputWeights )

    {

        ValidateTensorNumDimNumElem(m_InputToInputWeights->GetTensorInfo(), 2,

                                      (n_cell * n_input), "InputLayerNormWeights");

    }


    ValidatePointer(m_InputToForgetWeights, "Null pointer check", "InputToForgetWeights");

    ValidateTensorNumDimNumElem(m_InputToForgetWeights->GetTensorInfo(), 2,

                                  (n_cell * n_input), "InputToForgetWeights");


    ValidatePointer(m_InputToCellWeights, "Null pointer check", "InputToCellWeights");

    ValidateTensorNumDimNumElem(m_InputToCellWeights->GetTensorInfo(), 2,

                                  (n_cell * n_input), "InputToCellWeights");


    if ( m_RecurrentToInputWeights )

    {

        ValidateTensorNumDimNumElem(m_RecurrentToInputWeights->GetTensorInfo(), 2,

                                      (n_cell * n_output), "RecurrentToInputWeights");

    }


    ValidatePointer(m_RecurrentToForgetWeights, "Null pointer check", "RecurrentToForgetWeights");

    ValidateTensorNumDimNumElem(m_RecurrentToForgetWeights->GetTensorInfo(), 2,

                                  (n_cell * n_output), "RecurrentToForgetWeights");


    ValidatePointer(m_RecurrentToCellWeights, "Null pointer check", "RecurrentToCellWeights");

    ValidateTensorNumDimNumElem(m_RecurrentToCellWeights->GetTensorInfo(), 2,

                                  (n_cell * n_output), "RecurrentToCellWeights");


    // Make sure the input-gate's parameters are either both present (regular

    // LSTM) or not at all (CIFG-LSTM). And CifgEnable is set accordingly.

    bool cifg_weights_all_or_none = ((m_InputToInputWeights && m_RecurrentToInputWeights &&

                                     !m_Parameters.m_CifgEnabled) ||

                                     (!m_InputToInputWeights && !m_RecurrentToInputWeights &&

                                     m_Parameters.m_CifgEnabled));

    if (!cifg_weights_all_or_none)

    {

        throw InvalidArgumentException(descriptorName + ": Input-Gate's parameters InputToInputWeights and "

                                       "RecurrentToInputWeights must either both be present (regular LSTM) "

                                       "or both not present (CIFG-LSTM). In addition CifgEnable must be set "

                                       "accordingly.");

    }


    if ( m_CellToInputWeights )

    {

        ValidateTensorNumDimNumElem(m_CellToInputWeights->GetTensorInfo(), 1,

                                      n_cell, "CellToInputWeights");

    }

    if ( m_CellToForgetWeights )

    {

        ValidateTensorNumDimNumElem(m_CellToForgetWeights->GetTensorInfo(), 1,

                                      n_cell, "CellToForgetWeights");

    }

    if ( m_CellToOutputWeights )

    {

        ValidateTensorNumDimNumElem(m_CellToOutputWeights->GetTensorInfo(), 1,

                                      n_cell, "CellToOutputWeights");

    }


    // Making sure the peephole weights are there all or none. And PeepholeEnable is set accordingly.

    bool peephole_weights_all_or_none =

            (((m_CellToInputWeights || m_Parameters.m_CifgEnabled) &&  m_CellToForgetWeights

            && m_CellToOutputWeights && m_Parameters.m_PeepholeEnabled)

            || ( !m_CellToInputWeights && !m_CellToForgetWeights

            && !m_CellToOutputWeights && !m_Parameters.m_PeepholeEnabled));

    if (!peephole_weights_all_or_none)

    {

        throw InvalidArgumentException(descriptorName + ": Invalid combination of peephole parameters.");

    }


    // Make sure the input gate bias is present only when not a CIFG-LSTM.

    if (m_Parameters.m_CifgEnabled)

    {

        if (m_InputGateBias)

        {

            throw InvalidArgumentException(descriptorName + ": InputGateBias is present and CIFG-LSTM is enabled.");

        }

    }

    else

    {

        if (!m_InputGateBias)

        {

            throw InvalidArgumentException(descriptorName + ": If CIFG-LSTM is disabled InputGateBias "

                                           "must be present.");

        }

        ValidateTensorNumDimNumElem(m_InputGateBias->GetTensorInfo(), 1,

                                      n_cell, "InputGateBias");

    }


    ValidatePointer(m_ForgetGateBias, "Null pointer check", "ForgetGateBias");

    ValidateTensorNumDimNumElem(m_ForgetGateBias->GetTensorInfo(), 1, n_cell, "ForgetGateBias");


    ValidatePointer(m_CellBias, "Null pointer check", "CellBias");

    ValidateTensorNumDimNumElem(m_CellBias->GetTensorInfo(), 1, n_cell, "CellBias");


    ValidatePointer(m_OutputGateBias, "Null pointer check", "OutputGateBias");

    ValidateTensorNumDimNumElem(m_OutputGateBias->GetTensorInfo(), 1, n_cell, "OutputGateBias");


    if (m_ProjectionWeights)

    {

        ValidateTensorNumDimNumElem(m_ProjectionWeights->GetTensorInfo(), 2,

                                      (n_cell * n_output), "ProjectionWeights");

    }

    if (m_ProjectionBias)

    {

        ValidateTensorNumDimNumElem(m_ProjectionBias->GetTensorInfo(), 1, n_output, "ProjectionBias");

    }


    // Making sure the projection tensors are consistent:

    // 1) If projection weight is not present, then projection bias should not be

    // present.

    // 2) If projection weight is present, then projection bias is optional.

    bool projecton_tensors_consistent = ((!m_ProjectionWeights && !m_ProjectionBias &&

                                        !m_Parameters.m_ProjectionEnabled)

                                        || (m_ProjectionWeights && !m_ProjectionBias &&

                                        m_Parameters.m_ProjectionEnabled)

                                        || (m_ProjectionWeights && m_ProjectionBias &&

                                        m_Parameters.m_ProjectionEnabled));

    if (!projecton_tensors_consistent)

    {

        throw InvalidArgumentException(descriptorName + ": Projection tensors are inconsistent.");

    }


    // The four layer normalization weights either all have values or none of them have values. Additionally, if

    // CIFG is used, input layer normalization weights tensor is omitted and the other layer normalization weights

    // either all have values or none of them have values. Layer normalization is used when the values of all the

    // layer normalization weights are present

    if (m_InputLayerNormWeights)

    {

        ValidateTensorNumDimNumElem(m_InputLayerNormWeights->GetTensorInfo(), 1, n_cell, "InputLayerNormWeights");

    }

    if (m_ForgetLayerNormWeights)

    {

        ValidateTensorNumDimNumElem(m_ForgetLayerNormWeights->GetTensorInfo(), 1, n_cell, "ForgetLayerNormWeights");

    }

    if (m_CellLayerNormWeights)

    {

        ValidateTensorNumDimNumElem(m_CellLayerNormWeights->GetTensorInfo(), 1, n_cell, "CellLayerNormWeights");

    }

    if (m_OutputLayerNormWeights)

    {

        ValidateTensorNumDimNumElem(m_OutputLayerNormWeights->GetTensorInfo(), 1, n_cell, "OutputLayerNormWeights");

    }


    if (m_Parameters.m_LayerNormEnabled)

    {

        if (!m_Parameters.m_CifgEnabled)

        {

            if (!m_InputLayerNormWeights)

            {

                throw InvalidArgumentException(descriptorName + ": Layer normalisation is enabled and CIFG-LSTM is "

                                               "disabled but InputLayerNormWeights are not present");

            }

            ValidateTensorNumDimNumElem(m_InputLayerNormWeights->GetTensorInfo(),

                                          1, n_cell, "InputLayerNormWeights");

        }

        else if (m_InputLayerNormWeights)

        {

            throw InvalidArgumentException(descriptorName + ":InputLayerNormWeights are present while CIFG is "

                                           "enabled");

        }


        ValidatePointer(m_ForgetLayerNormWeights, "Null pointer check layer normalisation enabled",

                        "ForgetLayerNormWeights");

        ValidateTensorNumDimNumElem(m_ForgetLayerNormWeights->GetTensorInfo(), 1, n_cell, "ForgetLayerNormWeights");


        ValidatePointer(m_OutputLayerNormWeights, "Null pointer check layer normalisation enabled",

                        "OutputLayerNormWeights");

        ValidateTensorNumDimNumElem(m_OutputLayerNormWeights->GetTensorInfo(), 1, n_cell, "OutputLayerNormWeights");


        ValidatePointer(m_CellLayerNormWeights, "Null pointer check layer normalisation enabled",

                        "CellLayerNormWeights");

        ValidateTensorNumDimNumElem(m_CellLayerNormWeights->GetTensorInfo(), 1, n_cell, "CellLayerNormWeights");

    }

    else if (m_InputLayerNormWeights || m_ForgetLayerNormWeights || m_OutputLayerNormWeights || m_CellLayerNormWeights)

    {

        throw InvalidArgumentException(descriptorName + ": Layer normalisation is disabled but one or more layer "

                                       "normalisation weights are present.");

    }

}


void BatchMatMulQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string descriptorName{"BatchMatMulDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 2);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    // Inputs must be: both 2D+

    // For inputs X and Y whose dimensions to be multiplied are (M,N) and (I,J) respectively,

    // axes N and I must be the same size


    const auto& inputXInfoBeforeParams = workloadInfo.m_InputTensorInfos[0];

    const auto& inputYInfoBeforeParams = workloadInfo.m_InputTensorInfos[1];

    const auto& outputInfo = workloadInfo.m_OutputTensorInfos[0];

    // Output info has already been inferred


    std::vector<DataType> supportedTypes =

    {

        DataType::BFloat16,

        DataType::Float16,

        DataType::Float32,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS16

    };


    ValidateDataTypes(inputXInfoBeforeParams, supportedTypes, descriptorName);

    ValidateDataTypes(inputYInfoBeforeParams, supportedTypes, descriptorName);

    ValidateDataTypes(outputInfo, supportedTypes, descriptorName);


    if ((inputXInfoBeforeParams.GetNumDimensions() < 2) ||

        (inputYInfoBeforeParams.GetNumDimensions() < 2))

    {

        throw InvalidArgumentException(descriptorName + ": Input tensors are not 2D or greater.");

    }


    TensorInfo inputXInfoAfterParams;

    TensorInfo inputYInfoAfterParams;


    if((m_Parameters.m_TransposeX && m_Parameters.m_AdjointX) ||

       (m_Parameters.m_TransposeY && m_Parameters.m_AdjointY))

    {

        throw InvalidArgumentException(descriptorName +

            ": Invalid descriptor parameters - Transpose and Adjoint "

            "cannot both be true for a given input tensor.");

    }

    if(m_Parameters.m_TransposeX)

    {

        inputXInfoAfterParams = armnnUtils::Permuted(inputXInfoBeforeParams,

                                                     BatchMatMulDescriptor::GetPermuteVec(

                                                         m_Parameters.m_DataLayoutX,

                                                         inputXInfoBeforeParams.GetShape()));

    }

    else if(m_Parameters.m_AdjointX)

    {

        auto axesToMul = BatchMatMulDescriptor::GetAxesToMul(m_Parameters.m_DataLayoutX,

                                                             inputXInfoBeforeParams.GetShape());

        if(inputXInfoBeforeParams.GetShape()[axesToMul.first] !=

           inputXInfoBeforeParams.GetShape()[axesToMul.second])

        {

            throw InvalidArgumentException(descriptorName +

                ": Adjoint is set to true for input tensor X, but the axes to be adjointed are not square." );

        }

        // Shape remains the same as it's square

        inputXInfoAfterParams = inputXInfoBeforeParams;

    }

    else

    {

        inputXInfoAfterParams = inputXInfoBeforeParams;

    }


    if(m_Parameters.m_TransposeY)

    {

        inputYInfoAfterParams = armnnUtils::Permuted(inputYInfoBeforeParams,

                                                     BatchMatMulDescriptor::GetPermuteVec(

                                                         m_Parameters.m_DataLayoutY,

                                                         inputYInfoBeforeParams.GetShape()));

    }

    else if(m_Parameters.m_AdjointY)

    {

        auto axesToMul = BatchMatMulDescriptor::GetAxesToMul(m_Parameters.m_DataLayoutY,

                                                             inputYInfoBeforeParams.GetShape());

        if(inputYInfoBeforeParams.GetShape()[axesToMul.first] !=

           inputYInfoBeforeParams.GetShape()[axesToMul.second])

        {

            throw InvalidArgumentException(descriptorName +

                ": Adjoint is set to true for input tensor Y, but the axes to be adjointed are not square." );

        }

        // Shape remains the same as it's square

        inputYInfoAfterParams = inputYInfoBeforeParams;

    }

    else

    {

        inputYInfoAfterParams = inputYInfoBeforeParams;

    }


    switch(m_Parameters.m_DataLayoutX)

    {

        case DataLayout::NCDHW:

        case DataLayout::NDHWC:

            if(inputXInfoAfterParams.GetNumDimensions() < 3)

            {

                throw InvalidArgumentException(descriptorName +

                    ": Input tensor X does not have the correct "

                    "number of dimensions for the Data Layout that it has been assigned.");

            }

            break;

        case DataLayout::NCHW:

        case DataLayout::NHWC:

        default:

            break;

    }


    switch(m_Parameters.m_DataLayoutY)

    {

        case DataLayout::NCDHW:

        case DataLayout::NDHWC:

            if(inputYInfoAfterParams.GetNumDimensions() < 3)

            {

                throw InvalidArgumentException(descriptorName +

                    ": Input tensor Y does not have the correct "

                    "number of dimensions for the Data Layout that it has been assigned.");

            }

            break;

        case DataLayout::NCHW:

        case DataLayout::NHWC:

        default:

            break;

    }


    auto axesXToMul = BatchMatMulDescriptor::GetAxesToMul(m_Parameters.m_DataLayoutX,

        inputXInfoAfterParams.GetShape());

    auto axesYToMul = BatchMatMulDescriptor::GetAxesToMul(m_Parameters.m_DataLayoutY,

        inputXInfoBeforeParams.GetShape());


    if(inputXInfoAfterParams.GetShape()[axesXToMul.second]

       != inputYInfoAfterParams.GetShape()[axesYToMul.first])

    {

        throw InvalidArgumentException(descriptorName +

            ": The final axis of input tensor X must be the same size as "

            "the second last axis of input tensor Y.");

    }


    {   // Separate scope so we don't pollute the rest of the scope with our temp variables

        // e.g. NHWC isnt compatible with NCHW as of now

        DataLayout xLayout = m_Parameters.m_DataLayoutX;

        DataLayout yLayout = m_Parameters.m_DataLayoutY;


        if(xLayout == DataLayout::NCHW || xLayout == DataLayout::NCDHW)

        {

            if(yLayout == DataLayout::NHWC || yLayout == DataLayout::NDHWC)

            {

                throw InvalidArgumentException(descriptorName +

                    ": Invalid input tensor data layout combination.");

            }

        }

        if(yLayout == DataLayout::NCHW || yLayout == DataLayout::NCDHW)

        {

            if(xLayout == DataLayout::NHWC || xLayout == DataLayout::NDHWC)

            {

                throw InvalidArgumentException(descriptorName +

                    ": Invalid input tensor data layout combination.");

            }

        }

    }


    // Simulate aligning the ends of the matrix dims and prepending 1's to the beginning of the shorter one

    unsigned int outputTensorDimSize = std::max(inputXInfoAfterParams.GetNumDimensions(),

                                                inputYInfoAfterParams.GetNumDimensions());

    if(outputTensorDimSize-2 > 0)

    {

        TensorInfo tiXNotMul = TensorInfo(TensorShape(outputTensorDimSize-2),

                                          DataType::Float32);

        TensorInfo tiYNotMul = TensorInfo(TensorShape(outputTensorDimSize-2),

                                          DataType::Float32);

        TensorInfo tiOutNotMul = TensorInfo(TensorShape(outputTensorDimSize-2),

                                            DataType::Float32);


        auto doAxisExtension = [&](std::vector<unsigned int> axisIndices, TensorInfo& ti)

        {

            auto sizeDiff = (outputTensorDimSize-2) - axisIndices.size();


            for(unsigned int i = 0; i < sizeDiff; i++)

            {

                axisIndices.insert(axisIndices.begin(), 1);

            }


            for(unsigned int i = 0; i < ti.GetNumDimensions(); i++)

            {

                ti.GetShape()[i] = inputXInfoAfterParams.GetShape()[i];

            }

        };


        auto axesXNotMul = BatchMatMulDescriptor::GetAxesNotMul(m_Parameters.m_DataLayoutX,

                                                                inputXInfoAfterParams.GetShape());

        auto axesYNotMul = BatchMatMulDescriptor::GetAxesNotMul(m_Parameters.m_DataLayoutY,

                                                                inputYInfoAfterParams.GetShape());


        doAxisExtension(axesXNotMul, tiXNotMul);

        doAxisExtension(axesYNotMul, tiYNotMul);


        for(unsigned int i = 0; i < tiOutNotMul.GetNumDimensions(); i++)

        {

            tiOutNotMul.GetShape()[i] = std::max(tiXNotMul.GetShape()[i],

                                                 tiYNotMul.GetShape()[i]);

        }


        ValidateBroadcastTensorShapesMatch(tiXNotMul,

                                           tiYNotMul,

                                           tiOutNotMul,

                                           descriptorName,

                                           "input_X",

                                           "input_Y");

    }

}


void TileQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string& descriptorName{"TileQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo     = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo    = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

        DataType::Float32,

        DataType::Float16,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS8,

        DataType::QSymmS16,

        DataType::Signed32

    };


    // Multiples length must be the same as the number of dimensions in input.

    if (m_Parameters.m_Multiples.size() != inputTensorInfo.GetNumDimensions())

    {

        throw InvalidArgumentException(descriptorName +

                                       ": Multiples length is not same as the number of dimensions in Input.");

    }


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateDataTypes(outputTensorInfo, supportedTypes, descriptorName);

}


void BroadcastToQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string& descriptorName{"BroadcastToQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 1);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo     = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& outputTensorInfo    = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

        DataType::Float32,

        DataType::Float16,

        DataType::QAsymmS8,

        DataType::QAsymmU8,

        DataType::QSymmS8,

        DataType::QSymmS16,

        DataType::Signed32,

        DataType::Signed64

    };


    ValidateDataTypes(inputTensorInfo, supportedTypes, descriptorName);

    ValidateDataTypes(outputTensorInfo, supportedTypes, descriptorName);

}


void ScatterNdQueueDescriptor::Validate(const WorkloadInfo& workloadInfo) const

{

    const std::string& descriptorName{"ScatterQueueDescriptor"};


    ValidateNumInputs(workloadInfo,  descriptorName, 3);

    ValidateNumOutputs(workloadInfo, descriptorName, 1);


    const TensorInfo& inputTensorInfo0     = workloadInfo.m_InputTensorInfos[0];

    const TensorInfo& inputTensorInfo1     = workloadInfo.m_InputTensorInfos[1];

    const TensorInfo& inputTensorInfo2     = workloadInfo.m_InputTensorInfos[2];

    const TensorInfo& outputTensorInfo    = workloadInfo.m_OutputTensorInfos[0];


    std::vector<DataType> supportedTypes =

    {

            DataType::Float32,

            DataType::Float16,

            DataType::QAsymmS8,

            DataType::QAsymmU8,

            DataType::QSymmS8,

            DataType::QSymmS16,

            DataType::Signed32

    };


    std::vector<DataType> indicesSupportedTypes =

    {

            DataType::Signed32

    };


    if (m_Parameters.m_InputEnabled)

    {

        ValidateDataTypes(inputTensorInfo0, supportedTypes, descriptorName);

    }

    else

    {

        ValidateDataTypes(inputTensorInfo0, indicesSupportedTypes, descriptorName);

    }


    ValidateDataTypes(inputTensorInfo1, indicesSupportedTypes, descriptorName);

    ValidateDataTypes(inputTensorInfo2, supportedTypes, descriptorName);

    ValidateDataTypes(outputTensorInfo, supportedTypes, descriptorName);

}


} // namespace armnn