plain/20.05/_tf_lite_yolo_v3_big-_armnn_8cpp_source.xhtml

 //
 // Copyright © 2020 Arm Ltd. All rights reserved.
 // SPDX-License-Identifier: MIT
 //
 //#include "../InferenceTest.hpp"
 //#include "../ImagePreprocessor.hpp"
 #include "armnnTfLiteParser/ITfLiteParser.hpp"

 #include "NMS.hpp"

 #include <stb/stb_image.h>

 #include <armnn/INetwork.hpp>
 #include <armnn/IRuntime.hpp>
 #include <armnn/Logging.hpp>
 #include <armnn/utility/IgnoreUnused.hpp>

 #include <chrono>
 #include <iostream>
 #include <fstream>

 using namespace armnnTfLiteParser;
 using namespace armnn;

 static const int OPEN_FILE_ERROR = -2;
 static const int OPTIMIZE_NETWORK_ERROR = -3;
 static const int LOAD_NETWORK_ERROR = -4;
 static const int LOAD_IMAGE_ERROR = -5;
 static const int GENERAL_ERROR = -100;

 #define CHECK_OK(v)                                 \
     do {                                            \
         try {                                       \
             auto r_local = v;                       \
             if (r_local != 0) { return r_local;}    \
         }                                           \
         catch(armnn::Exception e)                                  \
         { \
             ARMNN_LOG(error) << "Oops: " << e.what(); \
             return GENERAL_ERROR; \
         }                 \
     } while(0)


 template<typename TContainer>
 inline armnn::InputTensors MakeInputTensors(const std::vector<armnn::BindingPointInfo>& inputBindings,
                                             const std::vector<TContainer>& inputDataContainers)
 {
     armnn::InputTensors inputTensors;

     const size_t numInputs = inputBindings.size();
     if (numInputs != inputDataContainers.size())
     {
         throw armnn::Exception("Mismatching vectors");
     }

     for (size_t i = 0; i < numInputs; i++)
     {
         const armnn::BindingPointInfo& inputBinding = inputBindings[i];
         const TContainer& inputData = inputDataContainers[i];

         armnn::ConstTensor inputTensor(inputBinding.second, inputData.data());
         inputTensors.push_back(std::make_pair(inputBinding.first, inputTensor));
     }

     return inputTensors;
 }

 template<typename TContainer>
 inline armnn::OutputTensors MakeOutputTensors(const std::vector<armnn::BindingPointInfo>& outputBindings,
                                               const std::vector<TContainer>& outputDataContainers)
 {
     armnn::OutputTensors outputTensors;

     const size_t numOutputs = outputBindings.size();
     if (numOutputs != outputDataContainers.size())
     {
         throw armnn::Exception("Mismatching vectors");
     }

     for (size_t i = 0; i < numOutputs; i++)
     {
         const armnn::BindingPointInfo& outputBinding = outputBindings[i];
         const TContainer& outputData = outputDataContainers[i];

         armnn::Tensor outputTensor(outputBinding.second, const_cast<float*>(outputData.data()));
         outputTensors.push_back(std::make_pair(outputBinding.first, outputTensor));
     }

     return outputTensors;
 }

 int LoadModel(const char* filename,
               ITfLiteParser& parser,
               IRuntime& runtime,
               NetworkId& networkId,
               const std::vector<BackendId>& backendPreferences)
 {
     std::ifstream stream(filename, std::ios::in | std::ios::binary);
     if (!stream.is_open())
     {
         ARMNN_LOG(error) << "Could not open model: " << filename;
         return OPEN_FILE_ERROR;
     }

     std::vector<uint8_t> contents((std::istreambuf_iterator<char>(stream)), std::istreambuf_iterator<char>());
     stream.close();

     auto model = parser.CreateNetworkFromBinary(contents);
     contents.clear();
     ARMNN_LOG(debug) << "Model loaded ok: " << filename;

     // Optimize backbone model
     auto optimizedModel = Optimize(*model, backendPreferences, runtime.GetDeviceSpec());
     if (!optimizedModel)
     {
         ARMNN_LOG(fatal) << "Could not optimize the model:" << filename;
         return OPTIMIZE_NETWORK_ERROR;
     }

     // Load backbone model into runtime
     {
         std::string errorMessage;
         INetworkProperties modelProps;
         Status status = runtime.LoadNetwork(networkId, std::move(optimizedModel), errorMessage, modelProps);
         if (status != Status::Success)
         {
             ARMNN_LOG(fatal) << "Could not load " << filename << " model into runtime: " << errorMessage;
             return LOAD_NETWORK_ERROR;
         }
     }

     return 0;
 }

 std::vector<float> LoadImage(const char* filename)
 {
     struct Memory
     {
         ~Memory() {stbi_image_free(m_Data);}
         bool IsLoaded() const { return m_Data != nullptr;}

         unsigned char* m_Data;
     };

     std::vector<float> image;

     int width;
     int height;
     int channels;

     Memory mem = {stbi_load(filename, &width, &height, &channels, 3)};
     if (!mem.IsLoaded())
     {
         ARMNN_LOG(error) << "Could not load input image file: " << filename;
         return image;
     }

     if (width != 1920 || height != 1080 || channels != 3)
     {
         ARMNN_LOG(error) << "Input image has wong dimension: " << width << "x" << height << "x" << channels << ". "
           " Expected 1920x1080x3.";
         return image;
     }

     image.resize(1920*1080*3);

     // Expand to float. Does this need de-gamma?
     for (unsigned int idx=0; idx <= 1920*1080*3; idx++)
     {
         image[idx] = static_cast<float>(mem.m_Data[idx]) /255.0f;
     }

     return image;
 }

 int main(int argc, char* argv[])
 {
     if (argc != 3)
     {
         ARMNN_LOG(error) << "Expected arguments: {PathToModels} {PathToData}";
     }
     std::string modelsPath(argv[1]);
     std::string imagePath(argv[2]);

     std::string backboneModelFile = modelsPath + "yolov3_1080_1920_backbone_int8.tflite";
     std::string detectorModelFile = modelsPath + "yolov3_1080_1920_detector_fp32.tflite";
     std::string imageFile = imagePath + "1080_1920.jpg";

     // Configure the logging
     SetAllLoggingSinks(true, true, true);
     SetLogFilter(LogSeverity::Trace);


     // Create runtime
     IRuntime::CreationOptions runtimeOptions; // default
     auto runtime = IRuntime::Create(runtimeOptions);
     if (!runtime)
     {
         ARMNN_LOG(fatal) << "Could not create runtime.";
         return -1;
     }

     // Create TfLite Parsers
     ITfLiteParser::TfLiteParserOptions parserOptions;
     auto parser = ITfLiteParser::Create(parserOptions);

     // Load backbone model
     ARMNN_LOG(info) << "Loading backbone...";
     NetworkId backboneId;
     CHECK_OK(LoadModel(backboneModelFile.c_str(), *parser, *runtime, backboneId, {"GpuAcc", "CpuRef"}));
     auto inputId = parser->GetNetworkInputBindingInfo(0, "inputs");
     auto bbOut0Id = parser->GetNetworkOutputBindingInfo(0, "input_to_detector_1");
     auto bbOut1Id = parser->GetNetworkOutputBindingInfo(0, "input_to_detector_2");
     auto bbOut2Id = parser->GetNetworkOutputBindingInfo(0, "input_to_detector_3");
     auto backboneProfile = runtime->GetProfiler(backboneId);
     backboneProfile->EnableProfiling(true);

     // Load detector model
     ARMNN_LOG(info) << "Loading detector...";
     NetworkId detectorId;
     CHECK_OK(LoadModel(detectorModelFile.c_str(), *parser, *runtime, detectorId, {"CpuAcc", "CpuRef"}));
     auto detectIn0Id = parser->GetNetworkInputBindingInfo(0, "input_to_detector_1");
     auto detectIn1Id = parser->GetNetworkInputBindingInfo(0, "input_to_detector_2");
     auto detectIn2Id = parser->GetNetworkInputBindingInfo(0, "input_to_detector_3");
     auto outputBoxesId = parser->GetNetworkOutputBindingInfo(0, "output_boxes");
     auto detectorProfile = runtime->GetProfiler(detectorId);

     // Load input from file
     ARMNN_LOG(info) << "Loading test image...";
     auto image = LoadImage(imageFile.c_str());
     if (image.empty())
     {
         return LOAD_IMAGE_ERROR;
     }


     // Allocate the intermediate tensors
     std::vector<float> intermediateMem0(bbOut0Id.second.GetNumElements());
     std::vector<float> intermediateMem1(bbOut1Id.second.GetNumElements());
     std::vector<float> intermediateMem2(bbOut2Id.second.GetNumElements());
     std::vector<float> intermediateMem3(outputBoxesId.second.GetNumElements());

     // Setup inputs and outputs
     using BindingInfos = std::vector<armnn::BindingPointInfo>;
     using FloatTensors = std::vector<std::vector<float>>;

     InputTensors bbInputTensors = MakeInputTensors(BindingInfos{inputId},
                                                    FloatTensors{std::move(image)});
     OutputTensors bbOutputTensors = MakeOutputTensors(BindingInfos{bbOut0Id, bbOut1Id, bbOut2Id},
                                                       FloatTensors{intermediateMem0,
                                                                    intermediateMem1,
                                                                    intermediateMem2});
     InputTensors detectInputTensors = MakeInputTensors(BindingInfos{detectIn0Id,
                                                                     detectIn1Id,
                                                                     detectIn2Id},
                                                        FloatTensors{intermediateMem0,
                                                                     intermediateMem1,
                                                                     intermediateMem2});
     OutputTensors detectOutputTensors = MakeOutputTensors(BindingInfos{outputBoxesId},
                                                           FloatTensors{intermediateMem3});

     static const int numIterations=2;
     using DurationUS = std::chrono::duration<double, std::micro>;
     std::vector<DurationUS> nmsDurations(0);
     nmsDurations.reserve(numIterations);
     for (int i=0; i < numIterations; i++)
     {
         // Execute backbone
         ARMNN_LOG(info) << "Running backbone...";
         runtime->EnqueueWorkload(backboneId, bbInputTensors, bbOutputTensors);

         // Execute detector
         ARMNN_LOG(info) << "Running detector...";
         runtime->EnqueueWorkload(detectorId, detectInputTensors, detectOutputTensors);

         // Execute NMS
         ARMNN_LOG(info) << "Running nms...";
         using clock = std::chrono::steady_clock;
         auto nmsStartTime = clock::now();
         yolov3::NMSConfig config;
         config.num_boxes = 127800;
         config.num_classes = 80;
         config.confidence_threshold = 0.9f;
         config.iou_threshold = 0.5f;
         auto filtered_boxes = yolov3::nms(config, intermediateMem3);
         auto nmsEndTime = clock::now();

         // Enable the profiling after the warm-up run
         if (i>0)
         {
             print_detection(std::cout, filtered_boxes);

             const auto nmsDuration = DurationUS(nmsStartTime - nmsEndTime);
             nmsDurations.push_back(nmsDuration);
         }
         backboneProfile->EnableProfiling(true);
         detectorProfile->EnableProfiling(true);
     }
     // Log timings to file
     std::ofstream backboneProfileStream("backbone.json");
     backboneProfile->Print(backboneProfileStream);
     backboneProfileStream.close();

     std::ofstream detectorProfileStream("detector.json");
     detectorProfile->Print(detectorProfileStream);
     detectorProfileStream.close();

     // Manually construct the json output
     std::ofstream nmsProfileStream("nms.json");
     nmsProfileStream << "{" << "\n";
     nmsProfileStream << R"(  "NmsTimings": {)" << "\n";
     nmsProfileStream << R"(    "raw": [)" << "\n";
     bool isFirst = true;
     for (auto duration : nmsDurations)
     {
         if (!isFirst)
         {
             nmsProfileStream << ",\n";
         }

         nmsProfileStream << "      " << duration.count();
         isFirst = false;
     }
     nmsProfileStream << "\n";
     nmsProfileStream << R"(    "units": "us")" << "\n";
     nmsProfileStream << "    ]" << "\n";
     nmsProfileStream << "  }" << "\n";
     nmsProfileStream << "}" << "\n";
     nmsProfileStream.close();

     ARMNN_LOG(info) << "Run completed";
     return 0;
 }
armnn::BoostLogSeverityMapping::debug

IgnoreUnused.hpp

armnnTfLiteParser::ITfLiteParser::TfLiteParserOptions
Definition: ITfLiteParser.hpp:28

armnn::SetAllLoggingSinks
void SetAllLoggingSinks(bool standardOut, bool debugOut, bool coloured)
Definition: Logging.cpp:146

IRuntime.hpp

armnnTfLiteParser::ITfLiteParser
Definition: ITfLiteParser.hpp:25

main
int main(int argc, char *argv[])
Definition: TfLiteYoloV3Big-Armnn.cpp:178

ARMNN_LOG
#define ARMNN_LOG(severity)
Definition: Logging.hpp:163

armnn::InputTensors
std::vector< std::pair< LayerBindingId, class ConstTensor > > InputTensors
Definition: Tensor.hpp:225

armnn::NetworkId
int NetworkId
Definition: IRuntime.hpp:20

armnn
Copyright (c) 2020 ARM Limited.
Definition: 00_introduction.dox:25

armnn::IRuntime
Definition: IRuntime.hpp:39

yolov3::NMSConfig::num_boxes
unsigned int num_boxes
Number of detected boxes.
Definition: NMS.hpp:15

armnn::BoostLogSeverityMapping::error

armnnTfLiteParser::ITfLiteParser::Create
static ITfLiteParserPtr Create(const armnn::Optional< TfLiteParserOptions > &options=armnn::EmptyOptional())
Definition: TfLiteParser.cpp:3239

MakeOutputTensors
armnn::OutputTensors MakeOutputTensors(const std::vector< armnn::BindingPointInfo > &outputBindings, const std::vector< TContainer > &outputDataContainers)
Definition: TfLiteYoloV3Big-Armnn.cpp:71

armnn::IRuntime::GetDeviceSpec
virtual const IDeviceSpec & GetDeviceSpec() const =0

armnn::INetworkProperties
Definition: IRuntime.hpp:27

armnn::Tensor
A tensor defined by a TensorInfo (shape and data type) and a mutable backing store.
Definition: Tensor.hpp:191

ITfLiteParser.hpp

LoadImage
std::vector< float > LoadImage(const char *filename)
Definition: TfLiteYoloV3Big-Armnn.cpp:137

armnn::SetLogFilter
void SetLogFilter(LogSeverity level)
Definition: Logging.cpp:28

armnn::Optimize
IOptimizedNetworkPtr Optimize(const INetwork &network, const std::vector< BackendId > &backendPreferences, const IDeviceSpec &deviceSpec, const OptimizerOptions &options=OptimizerOptions(), Optional< std::vector< std::string > &> messages=EmptyOptional())
Create an optimized version of the network.
Definition: Network.cpp:1003

yolov3::print_detection
void print_detection(std::ostream &os, const std::vector< Detection > &detections)
Print identified yolo detections.
Definition: NMS.cpp:83

CHECK_OK
#define CHECK_OK(v)
Definition: TfLiteYoloV3Big-Armnn.cpp:31

armnnTfLiteParser::ITfLiteParser::CreateNetworkFromBinary
virtual armnn::INetworkPtr CreateNetworkFromBinary(const std::vector< uint8_t > &binaryContent)=0
Create the network from a flatbuffers binary.

armnn::IRuntime::LoadNetwork
virtual Status LoadNetwork(NetworkId &networkIdOut, IOptimizedNetworkPtr network)=0
Loads a complete network into the IRuntime.

armnn::ConstTensor
A tensor defined by a TensorInfo (shape and data type) and an immutable backing store.
Definition: Tensor.hpp:199

armnn::OutputTensors
std::vector< std::pair< LayerBindingId, class Tensor > > OutputTensors
Definition: Tensor.hpp:226

armnn::Status
Status
enumeration
Definition: Types.hpp:26

armnn::BoostLogSeverityMapping::fatal

INetwork.hpp

Logging.hpp

armnn::IRuntime::CreationOptions
Definition: IRuntime.hpp:42

yolov3::NMSConfig::iou_threshold
float iou_threshold
Inclusion threshold for Intersection-Over-Union.
Definition: NMS.hpp:17

armnn::TContainer
boost::variant< std::vector< float >, std::vector< int >, std::vector< unsigned char > > TContainer
Definition: NetworkQuantizer.cpp:34

armnn::BindingPointInfo
std::pair< armnn::LayerBindingId, armnn::TensorInfo > BindingPointInfo
Definition: Tensor.hpp:146

armnn::Exception
Base class for all ArmNN exceptions so that users can filter to just those.
Definition: Exceptions.hpp:46

armnn::BoostLogSeverityMapping::info

yolov3::nms
std::vector< Detection > nms(const NMSConfig &config, const std::vector< float > &detected_boxes)
Perform Non-Maxima Supression on a list of given detections.
Definition: NMS.cpp:100

yolov3::NMSConfig
Non Maxima Suprresion configuration meta-data.
Definition: NMS.hpp:13

armnnTfLiteParser
Definition: ITfLiteParser.hpp:17

yolov3::NMSConfig::confidence_threshold
float confidence_threshold
Inclusion confidence threshold for a box.
Definition: NMS.hpp:16

NMS.hpp

MakeInputTensors
armnn::InputTensors MakeInputTensors(const std::vector< armnn::BindingPointInfo > &inputBindings, const std::vector< TContainer > &inputDataContainers)
Definition: TfLiteYoloV3Big-Armnn.cpp:47

LoadModel
int LoadModel(const char *filename, ITfLiteParser &parser, IRuntime &runtime, NetworkId &networkId, const std::vector< BackendId > &backendPreferences)
Definition: TfLiteYoloV3Big-Armnn.cpp:94

yolov3::NMSConfig::num_classes
unsigned int num_classes
Number of classes in the detected boxes.
Definition: NMS.hpp:14