plain/22.08/_arm_n_n_executor_8cpp_source.xhtml

 //
 // Copyright © 2022 Arm Ltd and Contributors. All rights reserved.
 // SPDX-License-Identifier: MIT
 //


 #include "ArmNNExecutor.hpp"
 #include "NetworkExecutionUtils/NetworkExecutionUtils.hpp"

 #include <armnn/IAsyncExecutionCallback.hpp>
 #include <AsyncExecutionCallback.hpp>


 using namespace armnn;
 using namespace std::chrono;

 ArmNNExecutor::ArmNNExecutor(const ExecuteNetworkParams& params, armnn::IRuntime::CreationOptions runtimeOptions)
 : m_Params(params)
 {
     runtimeOptions.m_EnableGpuProfiling = params.m_EnableProfiling;
     runtimeOptions.m_DynamicBackendsPath = params.m_DynamicBackendsPath;
     m_Runtime = armnn::IRuntime::Create(runtimeOptions);

     auto parser = CreateParser();
     auto network = parser->CreateNetwork(m_Params);
     auto optNet = OptimizeNetwork(network.get());

     m_IOInfo = GetIOInfo(optNet.get());
     SetupInputsAndOutputs();

     std::string errorMsg;

     armnn::ProfilingDetailsMethod profilingDetailsMethod = ProfilingDetailsMethod::Undefined;
     if (params.m_OutputDetailsOnlyToStdOut)
     {
         profilingDetailsMethod = armnn::ProfilingDetailsMethod::DetailsOnly;
     }
     else if (params.m_OutputDetailsToStdOut)
     {
         profilingDetailsMethod = armnn::ProfilingDetailsMethod::DetailsWithEvents;
     }

     INetworkProperties networkProperties{m_Params.m_Concurrent,
                                          MemorySource::Undefined,
                                          MemorySource::Undefined,
                                          params.m_EnableProfiling,
                                          profilingDetailsMethod};

     m_Runtime->LoadNetwork(m_NetworkId, std::move(optNet), errorMsg, networkProperties);

     if (m_Params.m_Iterations > 1)
     {
         std::stringstream msg;
         msg << "Network will be executed " << m_Params.m_Iterations;
         if (m_Params.m_Concurrent)
         {
             msg << " times in an asynchronous manner. ";
         }
         else
         {
             msg << " times successively. ";
         }
         msg << "The input-tensor-data files will be reused recursively if the user didn't provide enough to "
                "cover each execution.";
         ARMNN_LOG(info) << msg.str();
     }

     if (m_Params.m_GenerateTensorData)
     {
         ARMNN_LOG(warning) << "The input data was generated, note that the output will not be useful";
     }

     if (m_Params.m_DontPrintOutputs)
     {
         ARMNN_LOG(info) << "Printing outputs to console is disabled.";
     }
 }

 void ArmNNExecutor::ExecuteAsync()
 {
     std::vector<std::shared_ptr<armnn::IWorkingMemHandle>> memHandles;
     std::unique_ptr<armnn::Threadpool> threadpool;
     armnn::AsyncCallbackManager callbackManager;
     std::unordered_map<armnn::InferenceId, const armnn::OutputTensors*> inferenceOutputMap;

     for (size_t i = 0; i < m_Params.m_ThreadPoolSize; ++i)
     {
         memHandles.emplace_back(m_Runtime->CreateWorkingMemHandle(m_NetworkId));
     }

     threadpool = std::make_unique<armnn::Threadpool>(m_Params.m_ThreadPoolSize,
                                                      m_Runtime.get(),
                                                      memHandles);

     ARMNN_LOG(info) << "Asynchronous Execution with Arm NN thread pool...  \n";
     // Declare the latest and earliest inference times here to be used when calculating overall time
     std::chrono::high_resolution_clock::time_point earliestStartTime =
             std::chrono::high_resolution_clock::time_point::max();
     std::chrono::high_resolution_clock::time_point latestEndTime =
             std::chrono::high_resolution_clock::now();

     // For the asynchronous execution, we are adding a pool of working memory handles (1 per thread) in the
     // LoadedNetwork with each scheduled inference having a specific priority
     for (size_t i = 0; i < m_Params.m_Iterations; ++i)
     {
         std::shared_ptr<armnn::IProfiler> profiler = m_Runtime->GetProfiler(m_NetworkId);

         std::shared_ptr<armnn::AsyncExecutionCallback> cb = callbackManager.GetNewCallback();
         inferenceOutputMap.insert({cb->GetInferenceId(), &m_OutputTensorsVec[i]});
         threadpool->Schedule(m_NetworkId,
                              m_InputTensorsVec[i],
                              m_OutputTensorsVec[i],
                              armnn::QosExecPriority::Medium,
                              cb);
     }

     // Check the results
     for (size_t iteration = 0; iteration < m_Params.m_Iterations; ++iteration)
     {
         auto cb = callbackManager.GetNotifiedCallback();

         // Get the results
         if (earliestStartTime > cb->GetStartTime())
         {
             earliestStartTime = cb->GetStartTime();
         }
         if (latestEndTime < cb->GetEndTime())
         {
             latestEndTime = cb->GetEndTime();
         }

         auto startTime = time_point_cast<std::chrono::milliseconds>(cb->GetStartTime());
         auto endTime = time_point_cast<std::chrono::milliseconds>(cb->GetEndTime());
         auto inferenceDuration = endTime - startTime;
         CheckInferenceTimeThreshold(inferenceDuration, m_Params.m_ThresholdTime);
         if(!m_Params.m_DontPrintOutputs)
         {
             const armnn::OutputTensors* out = inferenceOutputMap[cb->GetInferenceId()];
             PrintOutputTensors(out, iteration);
         }
     }

     // Print duration difference between overallStartTime and overallEndTime
     auto overallEndTime = time_point_cast<std::chrono::milliseconds>(latestEndTime);
     auto overallStartTime = time_point_cast<std::chrono::milliseconds>(earliestStartTime);
     auto totalInferenceDuration = overallEndTime - overallStartTime;
     ARMNN_LOG(info) << "Overall Inference time: " << std::setprecision(2)
                     << std::fixed << totalInferenceDuration.count() << " ms\n";

 }

 void ArmNNExecutor::ExecuteSync()
 {
     for (size_t x = 0; x < m_Params.m_Iterations; x++)
     {
         std::shared_ptr<armnn::IProfiler> profiler = m_Runtime->GetProfiler(m_NetworkId);

         const auto start_time = armnn::GetTimeNow();
         armnn::Status ret;
         if (m_Params.m_ImportInputsIfAligned)
         {
              ret = m_Runtime->EnqueueWorkload(m_NetworkId,
                                               m_InputTensorsVec[x],
                                               m_OutputTensorsVec[x],
                                               m_ImportedInputIds[x],
                                               m_ImportedOutputIds[x]);
         }
         else
         {
             ret = m_Runtime->EnqueueWorkload(m_NetworkId,
                                              m_InputTensorsVec[x],
                                              m_OutputTensorsVec[x]);
         }

         const auto inferenceDuration = armnn::GetTimeDuration(start_time);

         // If profiling is enabled print out the results
         if(profiler && profiler->IsProfilingEnabled())
         {
             profiler->Print(std::cout);
         }

         if(ret == armnn::Status::Failure)
         {
             throw armnn::Exception("IRuntime::EnqueueWorkload failed");
         }

         if(!m_Params.m_DontPrintOutputs)
         {
             PrintOutputTensors(&m_OutputTensorsVec[x],  x);
         }

         // If thresholdTime == 0.0 (default), then it hasn't been supplied at command line
         CheckInferenceTimeThreshold(inferenceDuration, m_Params.m_ThresholdTime);
     }
 }

 std::vector<const void*> ArmNNExecutor::Execute()
 {
     if(m_Params.m_ThreadPoolSize == 0)
     {
         ExecuteSync();
     }
     else
     {
         ExecuteAsync();
     }
     std::vector<const void*> results;
     for (auto& output : m_OutputStorage)
     {
         results.push_back(output.m_Mem);
     }

     return results;
 }

 void ArmNNExecutor::PrintNetworkInfo()
 {
     const std::vector<std::string>& inputNames = m_Params.m_InputNames.size() != 0 ?
                                                  m_Params.m_InputNames :
                                                  m_IOInfo.m_InputNames;
     std::stringstream ss;
     ss << "===== Network Info =====\n";
     ss << "Inputs in order:\n";
     for (const auto& inputName : inputNames)
     {
         const auto inputInfo = m_IOInfo.m_InputInfoMap[inputName].second;
         ss <<  inputName << ", " << inputInfo.GetShape() << ", " << GetDataTypeName(inputInfo.GetDataType());
         if (inputInfo.IsQuantized())
         {
             ss << " Quantization Offset: " << inputInfo.GetQuantizationOffset();
             if (inputInfo.HasMultipleQuantizationScales())
             {
                 ss << " Quantization scales: ";
                 for (const auto scale: inputInfo.GetQuantizationScales())
                 {
                     ss << scale << ", ";
                 }
             }
             else
             {
                 ss << " Quantization scale: " << inputInfo.GetQuantizationScale();
             }
         }
         ss  << "\n";
     }

     ss << "Outputs in order:\n";
     for (const auto& outputName : m_IOInfo.m_OutputNames)
     {
         const auto outputInfo = m_IOInfo.m_OutputInfoMap[outputName].second;
         ss <<  outputName << ", " << outputInfo.GetShape() << ", " << GetDataTypeName(outputInfo.GetDataType());
         if (outputInfo.IsQuantized())
         {
             ss << " Quantization Offset: " << outputInfo.GetQuantizationOffset();
             if (outputInfo.HasMultipleQuantizationScales())
             {
                 ss << " Quantization scales: ";
                 for (const auto scale: outputInfo.GetQuantizationScales())
                 {
                     ss << scale << ", ";
                 }
             }
             else
             {
                 ss << " Quantization scale: " << outputInfo.GetQuantizationScale();
             }
         }
         ss  << "\n";
     }

     std::cout << ss.str() << std::endl;
 }

 void ArmNNExecutor::SetupInputsAndOutputs()
 {
     const unsigned int noOfInputs = m_IOInfo.m_InputNames.size();

     if (m_Params.m_InputNames.size() != 0 && m_Params.m_InputNames.size() != noOfInputs)
     {
         LogAndThrow("Number of input names does not match number of inputs");
     }

     const unsigned int inputFilePaths = m_Params.m_InputTensorDataFilePaths.size();
     const std::vector<std::string>& inputNames = m_Params.m_InputNames.size() != 0 ?
                                                  m_Params.m_InputNames :
                                                  m_IOInfo.m_InputNames;
     unsigned int noInputSets = 1;

     if (inputFilePaths != 0)
     {
         if (inputFilePaths % noOfInputs != 0)
         {
             LogAndThrow("Number of input files: " + std::to_string(inputFilePaths) +
                         " not compatible with number of inputs: " + std::to_string(noOfInputs));
         }
         noInputSets = inputFilePaths / noOfInputs;
         if (noInputSets != 1 && m_Params.m_ReuseBuffers)
         {
             LogAndThrow("Specifying multiple sets of inputs not compatible with ReuseBuffers");
         }
     }

     const unsigned int noOfOutputs = m_IOInfo.m_OutputNames.size();
     const unsigned int outputFilePaths = m_Params.m_OutputTensorFiles.size();
     unsigned int noOutputSets = 1;

     if (outputFilePaths != 0)
     {
         if (outputFilePaths % noOfOutputs != 0)
         {
             LogAndThrow("Number of output files: " + std::to_string(outputFilePaths) +
                         ", not compatible with number of outputs: " + std::to_string(noOfOutputs));
         }
         noOutputSets = outputFilePaths / noOfOutputs;

         if (noOutputSets != 1 && m_Params.m_ReuseBuffers)
         {
             LogAndThrow("Specifying multiple sets of outputs not compatible with ReuseBuffers");
         }
     }

     if (m_Params.m_ThreadPoolSize != 0)
     {
         // The current implementation of the Threadpool does not allow binding of outputs to a thread
         // So to ensure no two threads write to the same output at the same time, no output can be reused
         noOutputSets = m_Params.m_Iterations;
     }

     if (m_Params.m_InputTensorDataFilePaths.size() > noOfInputs)
     {
         ARMNN_LOG(info) << "Given network has " << noOfInputs << " input/s. One input-tensor-data file is required "
                         << "for each input. The user provided "
                         << m_Params.m_InputTensorDataFilePaths.size()
                         << " input-tensor-data file/s which will be used to fill the input/s.\n";
     }

     unsigned int inputCount = 0;
     for(unsigned int inputSet = 0; inputSet < noInputSets; ++inputSet)
     {
         armnn::InputTensors inputTensors;
         for (const auto& inputName: inputNames)
         {
             armnn::BindingPointInfo bindingPointInfo;
             try
             {
                 bindingPointInfo = m_IOInfo.m_InputInfoMap.at(inputName);
             }
             catch (const std::out_of_range& e)
             {
                 LogAndThrow("Input with inputName: " + inputName + " not found.");
             }

             const armnn::TensorInfo& tensorInfo = bindingPointInfo.second;
             auto newInfo = armnn::TensorInfo{tensorInfo.GetShape(), tensorInfo.GetDataType(),
                                              tensorInfo.GetQuantizationScale(),
                                              tensorInfo.GetQuantizationOffset(),
                                              true};

             m_InputStorage.emplace_back(IOStorage{tensorInfo.GetNumBytes()});

             const int bindingId = bindingPointInfo.first;
             inputTensors.emplace_back(bindingId, armnn::ConstTensor{newInfo, m_InputStorage.back().m_Mem});

             const armnn::Optional<std::string> dataFile = m_Params.m_GenerateTensorData ?
                                                           armnn::EmptyOptional() :
                                                           armnn::MakeOptional<std::string>(
                                                                   m_Params.m_InputTensorDataFilePaths.at(inputCount++));

             switch (tensorInfo.GetDataType())
             {
                 case armnn::DataType::Float32:
                 {
                     auto typedTensor = reinterpret_cast<float*>(m_InputStorage.back().m_Mem);
                     PopulateTensorWithData<float>(typedTensor, tensorInfo.GetNumElements(), dataFile, inputName);
                     break;
                 }
                 case armnn::DataType::QSymmS16:
                 {
                     auto typedTensor = reinterpret_cast<int16_t*>(m_InputStorage.back().m_Mem);
                     PopulateTensorWithData<int16_t>(typedTensor, tensorInfo.GetNumElements(), dataFile, inputName);
                     break;
                 }
                 case armnn::DataType::QSymmS8:
                 case armnn::DataType::QAsymmS8:
                 {
                     auto typedTensor = reinterpret_cast<int8_t*>(m_InputStorage.back().m_Mem);
                     PopulateTensorWithData<int8_t>(typedTensor, tensorInfo.GetNumElements(), dataFile, inputName);
                     break;
                 }
                 case armnn::DataType::QAsymmU8:
                 {
                     auto typedTensor = reinterpret_cast<uint8_t*>(m_InputStorage.back().m_Mem);
                     PopulateTensorWithData<uint8_t>(typedTensor, tensorInfo.GetNumElements(), dataFile, inputName);
                     break;
                 }
                 case armnn::DataType::Signed32:
                 {
                     auto typedTensor = reinterpret_cast<int32_t*>(m_InputStorage.back().m_Mem);
                     PopulateTensorWithData<int32_t>(typedTensor, tensorInfo.GetNumElements(), dataFile, inputName);
                     break;
                 }
                 default:
                 {
                     LogAndThrow("Unexpected DataType");
                 }
             }

             if (m_Params.m_ImportInputsIfAligned)
             {
                 m_ImportedInputIds.push_back(
                     m_Runtime->ImportInputs(m_NetworkId, m_InputTensorsVec.back(), armnn::MemorySource::Malloc));
             }
         }
         m_InputTensorsVec.emplace_back(inputTensors);
     }

     for(unsigned int outputSet = 0; outputSet < noOutputSets; ++outputSet)
     {
         armnn::OutputTensors outputTensors;
         for (const auto& output: m_IOInfo.m_OutputInfoMap)
         {
             const armnn::BindingPointInfo& bindingPointInfo = output.second;
             const armnn::TensorInfo& tensorInfo = bindingPointInfo.second;

             m_OutputStorage.emplace_back(tensorInfo.GetNumBytes());
             outputTensors.emplace_back(bindingPointInfo.first, armnn::Tensor{tensorInfo, m_OutputStorage.back().m_Mem});
         }
         m_OutputTensorsVec.emplace_back(outputTensors);
         if (m_Params.m_ImportInputsIfAligned)
         {
             m_ImportedOutputIds.push_back(
                     m_Runtime->ImportOutputs(m_NetworkId, m_OutputTensorsVec.back(), armnn::MemorySource::Malloc));
         }
     }

     // Fill the remaining iterations with copies
     const unsigned int remainingInputSets = m_Params.m_Iterations - noInputSets;
     for (unsigned int i = 1; i <= remainingInputSets; i++)
     {
         m_InputTensorsVec.push_back(m_InputTensorsVec[noInputSets % i]);
         if (m_Params.m_ImportInputsIfAligned)
         {
             m_ImportedInputIds.push_back(m_ImportedInputIds[noInputSets % i]);
         }
     }

     const unsigned int remainingOutputSets = m_Params.m_Iterations - noOutputSets;
     for (unsigned int i = 1; i <= remainingOutputSets; i++)
     {
         m_OutputTensorsVec.push_back(m_OutputTensorsVec[noOutputSets % i]);
         if (m_Params.m_ImportInputsIfAligned)
         {
             m_ImportedOutputIds.push_back(m_ImportedOutputIds[noOutputSets % i]);
         }
     }
 }

 ArmNNExecutor::IOInfo ArmNNExecutor::GetIOInfo(armnn::IOptimizedNetwork* optNet)
 {
     struct IOStrategy : armnn::IStrategy
     {
         void ExecuteStrategy(const armnn::IConnectableLayer* layer,
                              const armnn::BaseDescriptor& descriptor,
                              const std::vector<armnn::ConstTensor>& constants,
                              const char* name,
                              const armnn::LayerBindingId id = 0) override
         {
             armnn::IgnoreUnused(descriptor, constants, id);
             switch (layer->GetType())
             {
                 case armnn::LayerType::Input:
                 {
                     m_IOInfo.m_InputNames.emplace_back(name);
                     m_IOInfo.m_InputInfoMap[name] = {id, layer->GetOutputSlot(0).GetTensorInfo()};
                     break;
                 }
                 case armnn::LayerType::Output:
                 {
                     m_IOInfo.m_OutputNames.emplace_back(name);
                     m_IOInfo.m_OutputInfoMap[name] = {id, layer->GetInputSlot(0).GetConnection()->GetTensorInfo()};
                     break;
                 }
                 default: {}
             }
         }
         IOInfo m_IOInfo;
     };

     IOStrategy ioStrategy;
     optNet->ExecuteStrategy(ioStrategy);

     return ioStrategy.m_IOInfo;
 }

 armnn::IOptimizedNetworkPtr ArmNNExecutor::OptimizeNetwork(armnn::INetwork* network)
 {
     armnn::IOptimizedNetworkPtr optNet{nullptr, [](armnn::IOptimizedNetwork*){}};

     armnn::OptimizerOptions options;
     options.m_ReduceFp32ToFp16 = m_Params.m_EnableFp16TurboMode;
     options.m_ReduceFp32ToBf16 = m_Params.m_EnableBf16TurboMode;
     options.m_Debug = m_Params.m_PrintIntermediate;
     options.m_shapeInferenceMethod = m_Params.m_InferOutputShape ?
                                      armnn::ShapeInferenceMethod::InferAndValidate :
                                      armnn::ShapeInferenceMethod::ValidateOnly;
     options.m_ProfilingEnabled = m_Params.m_EnableProfiling;

     armnn::BackendOptions gpuAcc("GpuAcc",
                                  {
                                          { "FastMathEnabled", m_Params.m_EnableFastMath },
                                          { "SaveCachedNetwork", m_Params.m_SaveCachedNetwork },
                                          { "CachedNetworkFilePath", m_Params.m_CachedNetworkFilePath },
                                          { "MLGOTuningFilePath", m_Params.m_MLGOTuningFilePath }
                                  });

     armnn::BackendOptions cpuAcc("CpuAcc",
                                  {
                                          { "FastMathEnabled", m_Params.m_EnableFastMath },
                                          { "NumberOfThreads", m_Params.m_NumberOfThreads }
                                  });
     options.m_ModelOptions.push_back(gpuAcc);
     options.m_ModelOptions.push_back(cpuAcc);

     const auto optimization_start_time = armnn::GetTimeNow();
     optNet = armnn::Optimize(*network, m_Params.m_ComputeDevices, m_Runtime->GetDeviceSpec(), options);

     ARMNN_LOG(info) << "Optimization time: " << std::setprecision(2)
                     << std::fixed << armnn::GetTimeDuration(optimization_start_time).count() << " ms\n";

     if (!optNet)
     {
         LogAndThrow("Optimize returned nullptr");
     }

     // If v,visualize-optimized-model is enabled then construct a file name for the dot file.
     if (m_Params.m_EnableLayerDetails)
     {
         fs::path filename = m_Params.m_ModelPath;
         filename.replace_extension("dot");
         std::fstream file(filename.c_str(), std::ios_base::out);
         optNet->SerializeToDot(file);
     }

     return optNet;
 }

 std::unique_ptr<ArmNNExecutor::IParser> ArmNNExecutor::CreateParser()
 {
     // If no model format is given check the file name
     const std::string& modelFormat = m_Params.m_ModelPath;

     m_Params.m_IsModelBinary = modelFormat.find("json") == std::string::npos ? true : false;
     std::unique_ptr<IParser> parser = nullptr;
     // Forward to implementation based on the parser type
     if (modelFormat.find("armnn") != std::string::npos)
     {
 #if defined(ARMNN_SERIALIZER)
         parser = std::make_unique<ArmNNDeserializer>();
 #else
         LogAndThrow("Not built with serialization support.");
 #endif
     }
     else if(modelFormat.find("tflite") != std::string::npos)
     {
 #if defined(ARMNN_TF_LITE_PARSER)
         parser = std::make_unique<TfliteParser>(m_Params);
 #else
         LogAndThrow("Not built with Tensorflow-Lite parser support.");
 #endif
     }
     else if (modelFormat.find("onnx") != std::string::npos)
     {
 #if defined(ARMNN_ONNX_PARSER)
         parser = std::make_unique<OnnxParser>();
 #else
         LogAndThrow("Not built with Onnx parser support.");
 #endif
     }

     return parser;
 }

 void ArmNNExecutor::PrintOutputTensors(const armnn::OutputTensors* outputTensors,
                                        unsigned int iteration)
 {
     auto findOutputName = [&](const armnn::LayerBindingId id)
     {
         for (auto it = m_IOInfo.m_OutputInfoMap.begin(); it != m_IOInfo.m_OutputInfoMap.end(); ++it)
         {
             if (id == it->second.first)
             {
                 return it->first;
             }
         }
         return std::string{};
     };

     unsigned int outputIndex = 0;
     unsigned int numOutputs = outputTensors->size();
     for (const auto& output: *outputTensors)
     {
         const auto bindingName = findOutputName(output.first);
         // We've made sure before that the number of output files either equals numOutputs, in which
         // case we override those files when processing the results of each iteration (only the result
         // of the last iteration will be stored), or there are enough
         // output files for each output of each iteration.
         size_t outputFileIndex = iteration * numOutputs + outputIndex;
         if (!m_Params.m_OutputTensorFiles.empty())
         {
             outputFileIndex = outputFileIndex % m_Params.m_OutputTensorFiles.size();
             ARMNN_LOG(info) << "Writing output: " << bindingName << " bindingId: '"
                             << output.first
                             << "' of iteration: " << iteration + 1 << " to file: '"
                             << m_Params.m_OutputTensorFiles[outputFileIndex] << "'";
         }

         const armnn::Optional<std::string> outputTensorFile = m_Params.m_OutputTensorFiles.empty() ?
                                                               armnn::EmptyOptional() :
                                                               armnn::MakeOptional<std::string>(
                                                                       m_Params.m_OutputTensorFiles[outputFileIndex]);

         OutputWriteInfo outputWriteInfo
         {
             outputTensorFile,
             bindingName,
             output.second,
             !m_Params.m_DontPrintOutputs
         };

         std::cout << bindingName << ": ";
         std::vector<float> values;
         switch (output.second.GetDataType())
         {
             case armnn::DataType::Float32:
             {
                 PrintTensor<float>(outputWriteInfo, "%f ");
                 break;
             }

             case armnn::DataType::Signed32:
             {
                 PrintTensor<int>(outputWriteInfo, "%d ");
                 break;
             }
             case armnn::DataType::QSymmS8:
             case armnn::DataType::QAsymmS8:
             {
                 PrintTensor<int8_t>(outputWriteInfo, "%d ");
                 break;
             }
             case armnn::DataType::QAsymmU8:
             {
                 PrintTensor<uint8_t>(outputWriteInfo, "%d ");
                 break;
             }
             case armnn::DataType::Float16:
             case armnn::DataType::QSymmS16:
             case armnn::DataType::BFloat16:
             case armnn::DataType::Boolean:
             case armnn::DataType::Signed64:
             default:
             {
                 LogAndThrow("Unexpected DataType");
             }
         }
         std::cout << "\n";
     }
 }

 void ArmNNExecutor::CompareAndPrintResult(std::vector<const void*> otherOutput)
 {
     unsigned int index = 0;

     for (const auto& outputTensors: m_OutputTensorsVec)
     {
         for (const auto& outputTensor: outputTensors)
         {
             float result = 0;
             size_t size = outputTensor.second.GetNumBytes();

             switch (outputTensor.second.GetDataType())
             {
                 case armnn::DataType::Float32:
                 {
                     result = ComputeRMSE<float>(outputTensor.second.GetMemoryArea(), otherOutput[index++], size);
                     break;
                 }
                 case armnn::DataType::QSymmS16:
                 {
                     result = ComputeRMSE<int16_t>(outputTensor.second.GetMemoryArea(), otherOutput[index++], size);
                     break;
                 }
                 case armnn::DataType::QSymmS8:
                 case armnn::DataType::QAsymmS8:
                 {
                     result = ComputeRMSE<int8_t>(outputTensor.second.GetMemoryArea(), otherOutput[index++], size);
                     break;
                 }
                 case armnn::DataType::QAsymmU8:
                 {
                     result = ComputeRMSE<uint8_t>(outputTensor.second.GetMemoryArea(), otherOutput[index++], size);
                     break;
                 }
                 default:
                 {
                     LogAndThrow("Unexpected DataType");
                 }
             }
             std::cout << "RMSE: of " << result << "\n";
         }
     }
 }
 #if defined(ARMNN_SERIALIZER)
 ArmNNExecutor::ArmNNDeserializer::ArmNNDeserializer() : m_Parser(armnnDeserializer::IDeserializer::Create()){}

 armnn::INetworkPtr ArmNNExecutor::ArmNNDeserializer::CreateNetwork(const ExecuteNetworkParams& params)
 {
     const std::string& modelPath = params.m_ModelPath;

     std::ifstream file(modelPath, std::ios::binary);
     return m_Parser->CreateNetworkFromBinary(file);
 }

 armnn::BindingPointInfo
 ArmNNExecutor::ArmNNDeserializer::GetInputBindingPointInfo(size_t, const std::string& inputName)
 {
     armnnDeserializer::BindingPointInfo DeserializerBPI = m_Parser->GetNetworkInputBindingInfo(0, inputName);
     return {DeserializerBPI.m_BindingId, DeserializerBPI.m_TensorInfo};
 }

 armnn::BindingPointInfo
 ArmNNExecutor::ArmNNDeserializer::GetOutputBindingPointInfo(size_t, const std::string& outputName)
 {
     armnnDeserializer::BindingPointInfo DeserializerBPI = m_Parser->GetNetworkOutputBindingInfo(0, outputName);
     return {DeserializerBPI.m_BindingId, DeserializerBPI.m_TensorInfo};
 }
 #endif

 #if defined(ARMNN_TF_LITE_PARSER)
 ArmNNExecutor::TfliteParser::TfliteParser(const ExecuteNetworkParams& params)
 {
     armnnTfLiteParser::ITfLiteParser::TfLiteParserOptions options;
     options.m_StandInLayerForUnsupported = params.m_ParseUnsupported;
     options.m_InferAndValidate = params.m_InferOutputShape;

     m_Parser = armnnTfLiteParser::ITfLiteParser::Create(options);
 }

 armnn::INetworkPtr ArmNNExecutor::TfliteParser::CreateNetwork(const ExecuteNetworkParams& params)
 {
     const std::string& modelPath = params.m_ModelPath;
     return m_Parser->CreateNetworkFromBinaryFile(modelPath.c_str());
 }

 armnn::BindingPointInfo ArmNNExecutor::TfliteParser::GetInputBindingPointInfo(size_t subgraphId,
                                                                               const std::string& inputName)
 {
     return m_Parser->GetNetworkInputBindingInfo(subgraphId, inputName);
 }

 armnn::BindingPointInfo ArmNNExecutor::TfliteParser::GetOutputBindingPointInfo(size_t subgraphId,
                                                                                const std::string& outputName)
 {
     return m_Parser->GetNetworkOutputBindingInfo(subgraphId, outputName);
 }
 #endif


 #if defined(ARMNN_ONNX_PARSER)
 ArmNNExecutor::OnnxParser::OnnxParser() : m_Parser(armnnOnnxParser::IOnnxParser::Create()){}

 armnn::INetworkPtr ArmNNExecutor::OnnxParser::CreateNetwork(const ExecuteNetworkParams& params)
 {
     const std::string& modelPath = params.m_ModelPath;
     m_Parser = armnnOnnxParser::IOnnxParser::Create();
     std::map<std::string, armnn::TensorShape> inputShapes;
     if(!params.m_InputTensorShapes.empty())
     {
         const size_t numInputShapes = params.m_InputTensorShapes.size();
         const size_t numInputBindings = params.m_InputNames.size();
         if(numInputShapes < numInputBindings)
         {
             throw armnn::Exception(
                     fmt::format("Not every input has its tensor shape specified: expected={0}, got={1}",
                                 numInputBindings, numInputShapes));
         }

         for (size_t i = 0; i < numInputShapes; i++)
         {
             inputShapes[params.m_InputNames[i]] = params.m_InputTensorShapes[i];
         }

         return params.m_IsModelBinary ?
                m_Parser->CreateNetworkFromBinaryFile(modelPath.c_str(), inputShapes) :
                m_Parser->CreateNetworkFromTextFile(modelPath.c_str(), inputShapes);
     }

     // Handle text and binary input differently by calling the corresponding parser function
     return params.m_IsModelBinary ?
            m_Parser->CreateNetworkFromBinaryFile(params.m_ModelPath.c_str()) :
            m_Parser->CreateNetworkFromTextFile(params.m_ModelPath.c_str());
 }

 armnn::BindingPointInfo ArmNNExecutor::OnnxParser::GetInputBindingPointInfo(size_t, const std::string& inputName)
 {
     return m_Parser->GetNetworkInputBindingInfo(inputName);
 }

 armnn::BindingPointInfo ArmNNExecutor::OnnxParser::GetOutputBindingPointInfo(size_t, const std::string& outputName)
 {
     return m_Parser->GetNetworkOutputBindingInfo(outputName);
 }
 #endif
armnn::OptimizerOptions::m_ModelOptions
ModelOptions m_ModelOptions
Definition: INetwork.hpp:227

ExecuteNetworkParams::m_ModelPath
std::string m_ModelPath
Definition: ExecuteNetworkParams.hpp:45

armnn::IRuntime::Create
static IRuntimePtr Create(const CreationOptions &options)
Definition: Runtime.cpp:49

armnn::IConnectableLayer
Interface for a layer that is connectable to other layers via InputSlots and OutputSlots.
Definition: INetwork.hpp:68

IAsyncExecutionCallback.hpp

armnn::DataType::Boolean

armnn::GetTimeDuration
std::chrono::duration< double, std::milli > GetTimeDuration(std::chrono::high_resolution_clock::time_point start_time)
Definition: Timer.hpp:19

LogAndThrow
void LogAndThrow(std::string eMsg)
Definition: NetworkExecutionUtils.cpp:75

armnn::OptimizerOptions::m_shapeInferenceMethod
ShapeInferenceMethod m_shapeInferenceMethod
Definition: INetwork.hpp:221

armnn::experimental::AsyncCallbackManager::GetNewCallback
std::shared_ptr< AsyncExecutionCallback > GetNewCallback()
Definition: AsyncExecutionCallback.cpp:46

armnn::TensorInfo::GetShape
const TensorShape & GetShape() const
Definition: Tensor.hpp:191

armnnTfLiteParser::ITfLiteParser::TfLiteParserOptions
Definition: ITfLiteParser.hpp:29

armnn::Optional< std::string >

ExecuteNetworkParams::m_DontPrintOutputs
bool m_DontPrintOutputs
Definition: ExecuteNetworkParams.hpp:53

armnn::TensorInfo
Definition: Tensor.hpp:152

ExecuteNetworkParams::m_OutputDetailsOnlyToStdOut
bool m_OutputDetailsOnlyToStdOut
Definition: ExecuteNetworkParams.hpp:48

armnn::DataType::Signed32

ExecuteNetworkParams::m_DynamicBackendsPath
std::string m_DynamicBackendsPath
Definition: ExecuteNetworkParams.hpp:31

armnn::LayerType::Output

armnn::TensorInfo::GetNumBytes
unsigned int GetNumBytes() const
Definition: Tensor.cpp:427

armnn::ProfilingDetailsMethod::DetailsOnly

ExecuteNetworkParams::m_InputTensorShapes
std::vector< armnn::TensorShape > m_InputTensorShapes
Definition: ExecuteNetworkParams.hpp:43

ARMNN_LOG
#define ARMNN_LOG(severity)
Definition: Logging.hpp:205

armnn::INetwork
Main network class which provides the interface for building up a neural network. ...
Definition: INetwork.hpp:246

armnnTfLiteParser::ITfLiteParser::TfLiteParserOptions::m_InferAndValidate
bool m_InferAndValidate
Definition: ITfLiteParser.hpp:38

armnnDeserializer::IDeserializer::Create
static IDeserializerPtr Create()
Definition: Deserializer.cpp:47

armnn::DataType::QAsymmS8

armnn::OptimizerOptions::m_ReduceFp32ToBf16
bool m_ReduceFp32ToBf16
Reduces all Fp32 operators in the model to Bf16 for faster processing.
Definition: INetwork.hpp:218

armnn::InputTensors
std::vector< std::pair< LayerBindingId, class ConstTensor > > InputTensors
Definition: Tensor.hpp:392

armnn::DataType::Signed64

armnn::DataType::QSymmS16

armnn::GetTimeNow
std::chrono::high_resolution_clock::time_point GetTimeNow()
Definition: Timer.hpp:14

ArmNNExecutor::CompareAndPrintResult
void CompareAndPrintResult(std::vector< const void *> otherOutput) override
Compare the output with the result of another IExecutor.
Definition: ArmNNExecutor.cpp:671

ExecuteNetworkParams::m_Concurrent
bool m_Concurrent
Definition: ExecuteNetworkParams.hpp:29

armnn
Copyright (c) 2021 ARM Limited and Contributors.
Definition: 01_00_quick_start.dox:6

armnn::IgnoreUnused
void IgnoreUnused(Ts &&...)
Definition: IgnoreUnused.hpp:14

ExecuteNetworkParams::m_ParseUnsupported
bool m_ParseUnsupported
Definition: ExecuteNetworkParams.hpp:51

ExecuteNetworkParams::m_OutputTensorFiles
std::vector< std::string > m_OutputTensorFiles
Definition: ExecuteNetworkParams.hpp:50

ExecuteNetworkParams::m_ThreadPoolSize
size_t m_ThreadPoolSize
Definition: ExecuteNetworkParams.hpp:62

armnnTfLiteParser::ITfLiteParser::Create
static ITfLiteParserPtr Create(const armnn::Optional< TfLiteParserOptions > &options=armnn::EmptyOptional())
Definition: TfLiteParser.cpp:63

ExecuteNetworkParams::m_OutputDetailsToStdOut
bool m_OutputDetailsToStdOut
Definition: ExecuteNetworkParams.hpp:47

armnnDeserializer::BindingPointInfo
Definition: IDeserializer.hpp:18

armnn::LayerBindingId
int LayerBindingId
Type of identifiers for bindable layers (inputs, outputs).
Definition: Types.hpp:290

armnn::ProfilingDetailsMethod
ProfilingDetailsMethod
Define the behaviour of the internal profiler when outputting network details.
Definition: Types.hpp:71

armnn::GetDataTypeName
constexpr const char * GetDataTypeName(DataType dataType)
Definition: TypesUtils.hpp:202

armnn::INetworkProperties
Definition: IRuntime.hpp:35

armnn::BaseDescriptor
Base class for all descriptors.
Definition: Descriptors.hpp:22

armnn::Tensor
A tensor defined by a TensorInfo (shape and data type) and a mutable backing store.
Definition: Tensor.hpp:319

armnn::OptimizerOptions::m_ReduceFp32ToFp16
bool m_ReduceFp32ToFp16
Reduces all Fp32 operators in the model to Fp16 for faster processing.
Definition: INetwork.hpp:208

armnn::IStrategy
Definition: IStrategy.hpp:16

ExecuteNetworkParams::m_IsModelBinary
bool m_IsModelBinary
Definition: ExecuteNetworkParams.hpp:40

armnn::OptimizerOptions::m_Debug
bool m_Debug
Definition: INetwork.hpp:211

armnn::ProfilingDetailsMethod::DetailsWithEvents

OutputWriteInfo
Definition: NetworkExecutionUtils.hpp:187

ExecuteNetworkParams::m_Iterations
size_t m_Iterations
Definition: ExecuteNetworkParams.hpp:44

ExecuteNetworkParams::m_GenerateTensorData
bool m_GenerateTensorData
Definition: ExecuteNetworkParams.hpp:37

ExecuteNetworkParams
Holds all parameters necessary to execute a network Check ExecuteNetworkProgramOptions.cpp for a description of each parameter.
Definition: ExecuteNetworkParams.hpp:17

armnn::Optimize
IOptimizedNetworkPtr Optimize(const INetwork &network, const std::vector< BackendId > &backendPreferences, const IDeviceSpec &deviceSpec, const OptimizerOptions &options=OptimizerOptions(), Optional< std::vector< std::string > &> messages=EmptyOptional())
Create an optimized version of the network.
Definition: Network.cpp:1864

armnn::TensorInfo::GetQuantizationOffset
int32_t GetQuantizationOffset() const
Definition: Tensor.cpp:478

armnn::TensorInfo::GetQuantizationScale
float GetQuantizationScale() const
Definition: Tensor.cpp:461

armnn::TensorInfo::GetDataType
DataType GetDataType() const
Definition: Tensor.hpp:198

armnn::DataType::QAsymmU8

armnn::IOptimizedNetwork
Definition: INetwork.hpp:791

ArmNNExecutor.hpp

armnn::BoostLogSeverityMapping::warning

ExecuteNetworkParams::m_ThresholdTime
double m_ThresholdTime
Definition: ExecuteNetworkParams.hpp:57

armnn::ConstTensor
A tensor defined by a TensorInfo (shape and data type) and an immutable backing store.
Definition: Tensor.hpp:327

ExecuteNetworkParams::m_InputNames
std::vector< std::string > m_InputNames
Definition: ExecuteNetworkParams.hpp:41

armnn::ShapeInferenceMethod::ValidateOnly
Validate all output shapes.

armnn::OutputTensors
std::vector< std::pair< LayerBindingId, class Tensor > > OutputTensors
Definition: Tensor.hpp:393

armnn::DataType::Float16

armnn::Status
Status
enumeration
Definition: Types.hpp:42

armnn::IOptimizedNetworkPtr
std::unique_ptr< IOptimizedNetwork, void(*)(IOptimizedNetwork *network)> IOptimizedNetworkPtr
Definition: INetwork.hpp:239

armnn::OptimizerOptions::m_ProfilingEnabled
bool m_ProfilingEnabled
Definition: INetwork.hpp:230

armnn::MemorySource::Malloc

armnn::OptimizerOptions
ArmNN performs an optimization on each model/network before it gets loaded for execution.
Definition: INetwork.hpp:127

armnn::DataType::BFloat16

chrono

armnn::IConnectableLayer::GetType
virtual LayerType GetType() const =0
Returns the armnn::LayerType of this layer.

ExecuteNetworkParams::m_InputTensorDataFilePaths
std::vector< std::string > m_InputTensorDataFilePaths
Definition: ExecuteNetworkParams.hpp:42

ArmNNExecutor::PrintNetworkInfo
void PrintNetworkInfo() override
Print available information about the network.
Definition: ArmNNExecutor.cpp:217

armnn::IOptimizedNetwork::ExecuteStrategy
void ExecuteStrategy(IStrategy &strategy) const
Definition: Network.cpp:2956

armnn::IRuntime::CreationOptions
Definition: IRuntime.hpp:77

armnn::BackendOptions
Struct for the users to pass backend specific options.
Definition: BackendOptions.hpp:22

armnn::IRuntime::CreationOptions::m_DynamicBackendsPath
std::string m_DynamicBackendsPath
Setting this value will override the paths set by the DYNAMIC_BACKEND_PATHS compiler directive Only a...
Definition: IRuntime.hpp:98

armnn::IRuntime::CreationOptions::m_EnableGpuProfiling
bool m_EnableGpuProfiling
Setting this flag will allow the user to obtain GPU profiling information from the runtime...
Definition: IRuntime.hpp:93

armnn::EmptyOptional
EmptyOptional is used to initialize the Optional class in case we want to have default value for an O...
Definition: Optional.hpp:32

armnn::BindingPointInfo
std::pair< armnn::LayerBindingId, armnn::TensorInfo > BindingPointInfo
Definition: Tensor.hpp:274

ExecuteNetworkParams::m_ImportInputsIfAligned
bool m_ImportInputsIfAligned
Definition: ExecuteNetworkParams.hpp:63

armnnOnnxParser::IOnnxParser::Create
static IOnnxParserPtr Create()
Definition: OnnxParser.cpp:38

armnn::Status::Failure

armnnDeserializer::BindingPointInfo::m_TensorInfo
armnn::TensorInfo m_TensorInfo
Definition: IDeserializer.hpp:21

armnn::Exception
Base class for all ArmNN exceptions so that users can filter to just those.
Definition: Exceptions.hpp:46

armnn::BoostLogSeverityMapping::info

AsyncExecutionCallback.hpp

armnn::LayerType::Input

armnn::IConnectableLayer::GetInputSlot
virtual const IInputSlot & GetInputSlot(unsigned int index) const =0
Get a const input slot handle by slot index.

armnn::IOptimizedNetwork::SerializeToDot
Status SerializeToDot(std::ostream &stream) const
Definition: Network.cpp:509

ArmNNExecutor::Execute
std::vector< const void *> Execute() override
Execute the given network.
Definition: ArmNNExecutor.cpp:198

armnn::IInputSlot::GetConnection
virtual const IOutputSlot * GetConnection() const =0

armnn::experimental::AsyncCallbackManager
Definition: AsyncExecutionCallback.hpp:76

armnn::ShapeInferenceMethod::InferAndValidate
Infer missing output shapes and validate all output shapes.

armnn::DataType::Float32

armnn::IOutputSlot::GetTensorInfo
virtual const TensorInfo & GetTensorInfo() const =0

armnn::IConnectableLayer::GetOutputSlot
virtual const IOutputSlot & GetOutputSlot(unsigned int index) const =0
Get the const output slot handle by slot index.

CheckInferenceTimeThreshold
bool CheckInferenceTimeThreshold(const std::chrono::duration< double, std::milli > &duration, const double &thresholdTime)
Given a measured duration and a threshold time tell the user whether we succeeded or not...
Definition: NetworkExecutionUtils.cpp:17

armnn::DataType::QSymmS8

ExecuteNetworkParams::m_ReuseBuffers
bool m_ReuseBuffers
Definition: ExecuteNetworkParams.hpp:64

armnn::INetworkPtr
std::unique_ptr< INetwork, void(*)(INetwork *network)> INetworkPtr
Definition: INetwork.hpp:238

armnnDeserializer::BindingPointInfo::m_BindingId
armnn::LayerBindingId m_BindingId
Definition: IDeserializer.hpp:20

NetworkExecutionUtils.hpp

ArmNNExecutor::ArmNNExecutor
ArmNNExecutor(const ExecuteNetworkParams &params, armnn::IRuntime::CreationOptions runtimeOptions)
Definition: ArmNNExecutor.cpp:17

armnn::QosExecPriority::Medium

ExecuteNetworkParams::m_InferOutputShape
bool m_InferOutputShape
Definition: ExecuteNetworkParams.hpp:38

armnn::TensorInfo::GetNumElements
unsigned int GetNumElements() const
Definition: Tensor.hpp:196

ExecuteNetworkParams::m_EnableProfiling
bool m_EnableProfiling
Definition: ExecuteNetworkParams.hpp:36

armnn::experimental::AsyncCallbackManager::GetNotifiedCallback
std::shared_ptr< AsyncExecutionCallback > GetNotifiedCallback()
Definition: AsyncExecutionCallback.cpp:60

armnnTfLiteParser::ITfLiteParser::TfLiteParserOptions::m_StandInLayerForUnsupported
bool m_StandInLayerForUnsupported
Definition: ITfLiteParser.hpp:37