1 files changed, 424 insertions, 0 deletions
diff --git a/src/armnn/LoadedNetwork.cpp b/src/armnn/LoadedNetwork.cpp
new file mode 100644
index 0000000000..14712d209c
--- /dev/null
+++ b/src/armnn/LoadedNetwork.cpp
@@ -0,0 +1,424 @@
+//
+// Copyright © 2017 Arm Ltd. All rights reserved.
+// See LICENSE file in the project root for full license information.
+//
+
+#include "LoadedNetwork.hpp"
+#include "Layer.hpp"
+#include "Layers.hpp"
+#include "Graph.hpp"
+#include "Network.hpp"
+#include "Runtime.hpp"
+#include "Profiling.hpp"
+
+#ifdef ARMCOMPUTECL_ENABLED
+#include <arm_compute/core/CL/OpenCL.h>
+#endif
+
+#include <backends/CpuTensorHandle.hpp>
+
+#include <boost/polymorphic_cast.hpp>
+#include <boost/assert.hpp>
+#include <boost/format.hpp>
+#include <boost/log/trivial.hpp>
+
+namespace armnn
+{
+
+using namespace std;
+
+std::unique_ptr<LoadedNetwork> LoadedNetwork::MakeLoadedNetwork(std::unique_ptr<OptimizedNetwork> net,
+    const WorkloadFactories& workloadFactories)
+{
+    std::unique_ptr<LoadedNetwork> loadedNetwork;
+
+    try
+    {
+        loadedNetwork.reset(new LoadedNetwork(std::move(net), workloadFactories));
+    }
+    catch (const std::runtime_error& error)
+    {
+        BOOST_LOG_TRIVIAL(error) << "An error occurred when preparing the network workloads: " << error.what();
+        return std::unique_ptr<LoadedNetwork>();
+    }
+    catch (const armnn::Exception& error)
+    {
+        BOOST_LOG_TRIVIAL(error) << "An error occurred when preparing the network workloads: " << error.what();
+        return std::unique_ptr<LoadedNetwork>();
+    }
+#if ARMCOMPUTECL_ENABLED
+    catch (const cl::Error& error)
+    {
+        BOOST_LOG_TRIVIAL(error) << "A CL error occurred attempting to prepare a network workload: "
+            << error.what() << ". CL error code is: " << error.err();
+        return std::unique_ptr<LoadedNetwork>();
+    }
+#endif
+
+    return loadedNetwork;
+}
+
+LoadedNetwork::LoadedNetwork(std::unique_ptr<OptimizedNetwork> net, const WorkloadFactories& workloadFactories)
+:   m_OptimizedNetwork(std::move(net))
+{
+    Graph& order = m_OptimizedNetwork->GetGraph().TopologicalSort();
+    //first create tensor handlers
+    //handlers are created before workloads are
+    //because workload creation can modify some of the handlers
+    //(for example the splitter and merger layers)
+    for (auto&& layer : order)
+    {
+        layer->CreateTensorHandles(m_OptimizedNetwork->GetGraph(), *GetWorkloadFactory(*layer, workloadFactories));
+    }
+
+    //then create workloads
+    for (auto&& layer : order)
+    {
+        const shared_ptr<IWorkloadFactory> workloadFactory = GetWorkloadFactory(*layer, workloadFactories);
+
+        switch (layer->GetType())
+        {
+        case LayerType::Input:
+        case LayerType::Output:
+            {
+                // Inputs and outputs are treated in a special way - see EnqueueInput() and EnqueueOutput()
+                break;
+            }
+        default:
+            {
+                auto workload = layer->CreateWorkload(m_OptimizedNetwork->GetGraph(), *workloadFactory);
+
+                if (!workload)
+                {
+                    const char* const layerName = layer->GetNameStr().length() != 0 ? layer->GetName() : "<Unnamed>";
+                    throw InvalidArgumentException(boost::str(
+                        boost::format("No workload created for layer (name: '%1%' type: '%2%') (compute '%3%')")
+                        % layerName % static_cast<int>(layer->GetType()) % layer->GetComputeDevice()
+                    ));
+                }
+
+                m_WorkloadQueue.push_back(move(workload));
+                break;
+            }
+        }
+    }
+
+    // set up memory
+    m_OptimizedNetwork->GetGraph().AllocateDynamicBuffers();
+}
+
+TensorInfo LoadedNetwork::GetInputTensorInfo(LayerBindingId layerId) const
+{
+    for (auto&& inputLayer : m_OptimizedNetwork->GetGraph().GetInputLayers())
+    {
+        BOOST_ASSERT_MSG(inputLayer->GetNumOutputSlots() == 1, "Input layer should have exactly 1 output slot");
+        if (inputLayer->GetBindingId() == layerId)
+        {
+            return inputLayer->GetOutputSlot(0).GetTensorInfo();
+        }
+    }
+
+    throw InvalidArgumentException(boost::str(boost::format("No input layer is associated with id %1%") % layerId));
+}
+
+TensorInfo LoadedNetwork::GetOutputTensorInfo(LayerBindingId layerId) const
+{
+    for (auto&& outputLayer : m_OptimizedNetwork->GetGraph().GetOutputLayers())
+    {
+        BOOST_ASSERT_MSG(outputLayer->GetNumInputSlots() == 1, "Output layer should have exactly 1 input slot");
+        BOOST_ASSERT_MSG(outputLayer->GetInputSlot(0).GetConnection(), "Input slot on Output layer must be connected");
+        if (outputLayer->GetBindingId() == layerId)
+        {
+            return outputLayer->GetInputSlot(0).GetConnection()->GetTensorInfo();
+        }
+    }
+
+    throw InvalidArgumentException(boost::str(boost::format("No output layer is associated with id %1%") % layerId));
+}
+
+const shared_ptr<IWorkloadFactory> LoadedNetwork::GetWorkloadFactory(const Layer& layer,
+    const WorkloadFactories& workloadFactories) const
+{
+    shared_ptr<IWorkloadFactory> workloadFactory;
+
+    switch (layer.GetComputeDevice())
+    {
+        case Compute::CpuAcc:
+        {
+            workloadFactory = workloadFactories.m_CpuAcc;
+            break;
+        }
+        case Compute::GpuAcc:
+        {
+            workloadFactory = workloadFactories.m_GpuAcc;
+            break;
+        }
+        case Compute::CpuRef:
+        default:
+        {
+            workloadFactory = workloadFactories.m_CpuRef;
+            break;
+        }
+    }
+
+    BOOST_ASSERT_MSG(workloadFactory, "No workload factory");
+
+    std::string reasonIfUnsupported;
+    BOOST_ASSERT_MSG(IWorkloadFactory::IsLayerSupported(layer, layer.GetDataType(), reasonIfUnsupported),
+                     "Factory does not support layer");
+    boost::ignore_unused(reasonIfUnsupported);
+
+    return workloadFactory;
+}
+
+namespace {
+
+// Non-copyable class owning accelerator-specific tensor data.
+class TensorPin
+{
+public:
+    TensorPin(std::unique_ptr<ITensorHandle> handle, const TensorInfo& info, LayerBindingId id)
+        : m_TensorHandle(std::move(handle))
+        , m_TensorInfo(info)
+        , m_Id(id)
+    {
+    }
+
+    ITensorHandle* GetTensorHandle() const { return m_TensorHandle.get(); }
+    const TensorInfo& GetTensorInfo() const { return m_TensorInfo; }
+    LayerBindingId GetBindingId() const { return m_Id; }
+
+private:
+    std::unique_ptr<ITensorHandle> m_TensorHandle;
+    TensorInfo m_TensorInfo;
+    LayerBindingId m_Id;
+};
+
+static const TensorPin& GetTensorPin(LayerBindingId id,
+    const std::vector<TensorPin>& pins,
+    char const* bindingPointDesc)
+{
+    auto it = std::find_if(pins.begin(), pins.end(),
+        [id](const TensorPin& pin)
+    {
+        return pin.GetBindingId() == id;
+    });
+
+    if (it != pins.end())
+    {
+        return *it;
+    }
+    else
+    {
+        throw InvalidArgumentException(boost::str(
+            boost::format("No tensor supplied for %1% %2%") % bindingPointDesc % id));
+    }
+}
+
+// Stores data that needs to be kept accessible for the entire execution of a workload.
+class WorkloadData
+{
+public:
+    WorkloadData(const InputTensors& inputTensors, const OutputTensors& outputTensors)
+    {
+        m_InputTensorPins.reserve(inputTensors.size());
+        m_OutputTensorPins.reserve(outputTensors.size());
+
+        for (auto inputTensorPair : inputTensors)
+        {
+            auto inputTensor = inputTensorPair.second;
+
+            std::unique_ptr<ITensorHandle> tensorHandle =
+                std::make_unique<ConstPassthroughCpuTensorHandle>(inputTensor.GetInfo(),inputTensor.GetMemoryArea());
+            LayerBindingId layerId = inputTensorPair.first;
+
+            m_InputTensorPins.emplace_back(std::move(tensorHandle), inputTensor.GetInfo(), layerId);
+        }
+
+        for (auto outputTensorPair : outputTensors)
+        {
+            auto outputTensor = outputTensorPair.second;
+
+            std::unique_ptr<ITensorHandle> tensorHandle =
+                std::make_unique<PassthroughCpuTensorHandle>(outputTensor.GetInfo(), outputTensor.GetMemoryArea());
+            LayerBindingId layerId = outputTensorPair.first;
+
+            m_OutputTensorPins.emplace_back(std::move(tensorHandle), outputTensor.GetInfo(), layerId);
+        }
+    }
+
+    const TensorPin& GetInputTensorPin(LayerBindingId id) const
+    {
+        return GetTensorPin(id, m_InputTensorPins, "input");
+    }
+
+    const TensorPin& GetOutputTensorPin(LayerBindingId id) const
+    {
+        return GetTensorPin(id, m_OutputTensorPins, "output");
+    }
+
+private:
+
+    std::vector<TensorPin> m_InputTensorPins;
+    std::vector<TensorPin> m_OutputTensorPins;
+};
+
+}
+
+Status LoadedNetwork::EnqueueWorkload(const InputTensors& inputTensors,
+                                      const OutputTensors& outputTensors,
+                                      const WorkloadFactories& workloadFactories)
+{
+    ARMNN_UPDATE_PROFILING_EVENT_TAG();
+    ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "EnqueueWorkload");
+
+    const Graph& graph = m_OptimizedNetwork->GetGraph();
+
+    // Walk graph to determine the order of execution
+    if (graph.GetNumLayers() < 2)
+    {
+        BOOST_LOG_TRIVIAL(warning) << "IRuntime::EnqueueWorkload()::Less than two nodes in graph";
+        return Status::Failure;
+    }
+
+    // Data that must be kept alive for the entire execution of the workload
+    WorkloadData workloadData(inputTensors, outputTensors);
+
+    if (graph.GetNumInputs() != inputTensors.size())
+    {
+        throw InvalidArgumentException("Number of inputs provided does not match network.");
+    }
+
+    // for each input to the network, call EnqueueInput with the data passed by the user
+    for (const BindableLayer* inputLayer : graph.GetInputLayers())
+    {
+        const TensorPin& pin = workloadData.GetInputTensorPin(inputLayer->GetBindingId());
+        EnqueueInput(*inputLayer, pin.GetTensorHandle(), pin.GetTensorInfo(), workloadFactories);
+    }
+
+    // for each output to the network, call EnqueueOutput with the data passed by the user
+    for (const BindableLayer* outputLayer : graph.GetOutputLayers())
+    {
+        const TensorPin& pin = workloadData.GetOutputTensorPin(outputLayer->GetBindingId());
+        EnqueueOutput(*outputLayer, pin.GetTensorHandle(), pin.GetTensorInfo(), workloadFactories);
+    }
+
+    bool executionSucceeded = true;
+
+    {
+        ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Execute");
+        executionSucceeded = Execute();
+    }
+
+    // Hack: get rid of inputs and outputs we added
+    TidyWorkloadQueue(graph.GetNumInputs(), graph.GetNumOutputs());
+
+    return executionSucceeded ? Status::Success : Status::Failure;
+}
+
+void LoadedNetwork::EnqueueInput(const BindableLayer& layer, ITensorHandle* tensorHandle, const TensorInfo& tensorInfo,
+    const WorkloadFactories& workloadFactories)
+{
+    if (layer.GetType() != LayerType::Input)
+    {
+        throw InvalidArgumentException("EnqueueInput: given layer not an InputLayer");
+    }
+
+    if (tensorHandle == nullptr)
+    {
+        throw InvalidArgumentException("EnqueueInput: tensorHandle must not be NULL");
+    }
+
+    InputQueueDescriptor inputQueueDescriptor;
+    WorkloadInfo info;
+
+    inputQueueDescriptor.m_Inputs.push_back(tensorHandle);
+    info.m_InputTensorInfos.push_back(tensorInfo);
+
+    BOOST_ASSERT_MSG(layer.GetNumOutputSlots() == 1, "Can only handle Input Layer with one output");
+    const OutputHandler& handler = layer.GetOutputHandler();
+    const TensorInfo& outputTensorInfo = handler.GetTensorInfo();
+    ITensorHandle* outputTensorHandle = handler.GetData();
+    BOOST_ASSERT_MSG(outputTensorHandle != nullptr,
+                     "Data should have been allocated.");
+    inputQueueDescriptor.m_Outputs.push_back(outputTensorHandle);
+    info.m_OutputTensorInfos.push_back(outputTensorInfo);
+
+    shared_ptr<IWorkloadFactory> workloadFactory = GetWorkloadFactory(layer, workloadFactories);
+    auto inputWorkload = workloadFactory->CreateInput(inputQueueDescriptor, info);
+    BOOST_ASSERT_MSG(inputWorkload, "No input workload created");
+    m_WorkloadQueue.insert(m_WorkloadQueue.begin(), move(inputWorkload));
+}
+
+void LoadedNetwork::EnqueueOutput(const BindableLayer& layer, ITensorHandle* tensorHandle,
+    const TensorInfo& tensorInfo, const WorkloadFactories& workloadFactories)
+{
+    if (layer.GetType() != LayerType::Output)
+    {
+        throw InvalidArgumentException("EnqueueOutput: given layer not an OutputLayer");
+    }
+
+    if (tensorHandle == nullptr)
+    {
+        throw InvalidArgumentException("EnqueueOutput: tensorHandle must not be NULL");
+    }
+
+    OutputQueueDescriptor outputQueueDescriptor;
+    WorkloadInfo info;
+
+    outputQueueDescriptor.m_Outputs.push_back(tensorHandle);
+    info.m_OutputTensorInfos.push_back(tensorInfo);
+
+    BOOST_ASSERT_MSG(layer.GetNumInputSlots() == 1, "Output Layer should have exactly one input.");
+
+    // Get the output handler from the previous node
+    const OutputHandler& outputHandler = layer.GetInputSlots()[0].GetConnectedOutputSlot()->GetOutputHandler();
+
+    const TensorInfo& inputTensorInfo = outputHandler.GetTensorInfo();
+    ITensorHandle* inputTensorHandle = outputHandler.GetData();
+    BOOST_ASSERT_MSG(inputTensorHandle != nullptr, "Data should have been allocated.");
+
+    outputQueueDescriptor.m_Inputs.push_back(inputTensorHandle);
+    info.m_InputTensorInfos.push_back(inputTensorInfo);
+
+    shared_ptr<IWorkloadFactory> workloadFactory = GetWorkloadFactory(layer, workloadFactories);
+    auto                         outputWorkload  = workloadFactory->CreateOutput(outputQueueDescriptor, info);
+    BOOST_ASSERT_MSG(outputWorkload, "No output workload created");
+    m_WorkloadQueue.push_back(move(outputWorkload));
+}
+
+bool LoadedNetwork::Execute()
+{
+    bool success = true;
+
+    try
+    {
+        for (size_t i = 0; i < m_WorkloadQueue.size(); ++i)
+        {
+            m_WorkloadQueue[i]->Execute();
+        }
+    }
+#if ARMCOMPUTECL_ENABLED
+    catch (const cl::Error& error)
+    {
+        BOOST_LOG_TRIVIAL(error) << "A CL error occurred attempting to execute a workload: "
+            << error.what() << ". CL error code is: " << error.err();
+        success = false;
+    }
+#endif
+    catch (const std::runtime_error& error)
+    {
+        BOOST_LOG_TRIVIAL(error) << "An error occurred attempting to execute a workload: " << error.what();
+        success = false;
+    }
+
+    return success;
+}
+
+void LoadedNetwork::TidyWorkloadQueue(size_t numInputs, size_t numOutputs)
+{
+    m_WorkloadQueue.erase(m_WorkloadQueue.begin(), m_WorkloadQueue.begin() + boost::numeric_cast<long>(numInputs));
+    m_WorkloadQueue.erase(m_WorkloadQueue.end() - boost::numeric_cast<long>(numOutputs), m_WorkloadQueue.end());
+}
+
+}