#include <INetwork.hpp>

Public Member Functions
Status	PrintGraph ()

Status	SerializeToDot (std::ostream &stream) const

profiling::ProfilingGuid	GetGuid () const

size_t	GetNumInputs () const

size_t	GetNumOutputs () const

	IOptimizedNetwork (const IOptimizedNetwork &other, const ModelOptions &modelOptions)

	IOptimizedNetwork (std::unique_ptr< Graph > graph)

	IOptimizedNetwork (std::unique_ptr< OptimizedNetworkImpl > impl)

	~IOptimizedNetwork ()

const std::shared_ptr< IProfiler > &	GetProfiler () const

Static Public Member Functions
static void	Destroy (IOptimizedNetwork *network)

Protected Member Functions
	IOptimizedNetwork (std::unique_ptr< Graph > graph, const ModelOptions &modelOptions)

Protected Attributes
std::unique_ptr< OptimizedNetworkImpl >	pOptimizedNetworkImpl

Friends
class	LoadedNetwork

class	experimental::AsyncNetworkImpl

class	experimental::WorkingMemHandle

Graph &	GetGraphForTesting (IOptimizedNetwork *optNetPtr)

ModelOptions &	GetModelOptionsForTesting (IOptimizedNetwork *optNetPtr)

IOptimizedNetworkPtr	Optimize (const INetwork &inNetwork, const std::vector< BackendId > &backendPreferences, const IDeviceSpec &deviceSpec, const OptimizerOptions &options, Optional< std::vector< std::string > &> messages)
	Create an optimized version of the network. More...

Detailed Description

Definition at line 790 of file INetwork.hpp.

Constructor & Destructor Documentation

◆ IOptimizedNetwork() [1/4]

IOptimizedNetwork	(	const IOptimizedNetwork &	other,
		const ModelOptions &	modelOptions
	)

Definition at line 502 of file Network.cpp.

Referenced by armnn::Optimize().

503 : pOptimizedNetworkImpl(new OptimizedNetworkImpl(*other.pOptimizedNetworkImpl.get(), modelOptions)) {}

armnn::IOptimizedNetwork::pOptimizedNetworkImpl

std::unique_ptr< OptimizedNetworkImpl > pOptimizedNetworkImpl

Definition: INetwork.hpp:828

◆ IOptimizedNetwork() [2/4]

IOptimizedNetwork ( std::unique_ptr< Graph > graph )

Definition at line 505 of file Network.cpp.

506 : pOptimizedNetworkImpl(new OptimizedNetworkImpl(std::move(graph))) {}

armnn::IOptimizedNetwork::pOptimizedNetworkImpl

std::unique_ptr< OptimizedNetworkImpl > pOptimizedNetworkImpl

Definition: INetwork.hpp:828

◆ IOptimizedNetwork() [3/4]

IOptimizedNetwork ( std::unique_ptr< OptimizedNetworkImpl > impl )

Definition at line 508 of file Network.cpp.

509 : pOptimizedNetworkImpl(std::move(impl)) {}

armnn::IOptimizedNetwork::pOptimizedNetworkImpl

std::unique_ptr< OptimizedNetworkImpl > pOptimizedNetworkImpl

Definition: INetwork.hpp:828

◆ ~IOptimizedNetwork()

~IOptimizedNetwork ( )

default

Referenced by IOptimizedNetwork::IOptimizedNetwork().

◆ IOptimizedNetwork() [4/4]

IOptimizedNetwork	(	std::unique_ptr< Graph >	graph,
		const ModelOptions &	modelOptions
	)

protected

Definition at line 511 of file Network.cpp.

References IOptimizedNetwork::~IOptimizedNetwork().

512 : pOptimizedNetworkImpl(new OptimizedNetworkImpl(std::move(graph), modelOptions)) {}

armnn::IOptimizedNetwork::pOptimizedNetworkImpl

std::unique_ptr< OptimizedNetworkImpl > pOptimizedNetworkImpl

Definition: INetwork.hpp:828

Member Function Documentation

◆ Destroy()

void Destroy ( IOptimizedNetwork * network )

static

Definition at line 516 of file Network.cpp.

Referenced by armnn::Optimize(), and TEST_SUITE().

 {
     delete network;
 }

◆ GetGuid()

profiling::ProfilingGuid GetGuid ( ) const

Definition at line 536 of file Network.cpp.

References IOptimizedNetwork::pOptimizedNetworkImpl.

 {
     return pOptimizedNetworkImpl->GetGuid();
 }

◆ GetNumInputs()

size_t GetNumInputs ( ) const

Definition at line 541 of file Network.cpp.

References IOptimizedNetwork::pOptimizedNetworkImpl.

 {
     return pOptimizedNetworkImpl->GetNumInputs();
 }

◆ GetNumOutputs()

size_t GetNumOutputs ( ) const

Definition at line 546 of file Network.cpp.

References IOptimizedNetwork::pOptimizedNetworkImpl.

 {
     return pOptimizedNetworkImpl->GetNumOutputs();
 }

◆ GetProfiler()

const std::shared_ptr< IProfiler > & GetProfiler ( ) const

Definition at line 531 of file Network.cpp.

References IOptimizedNetwork::pOptimizedNetworkImpl.

 {
     return pOptimizedNetworkImpl->GetGraph().GetProfiler();
 }

◆ PrintGraph()

Status PrintGraph ( )

Definition at line 521 of file Network.cpp.

References IOptimizedNetwork::pOptimizedNetworkImpl.

 {
     return pOptimizedNetworkImpl->PrintGraph();
 }

◆ SerializeToDot()

Status SerializeToDot ( std::ostream & stream ) const

Definition at line 526 of file Network.cpp.

References IOptimizedNetwork::pOptimizedNetworkImpl.

 {
     return pOptimizedNetworkImpl->SerializeToDot(stream);
 }

Friends And Related Function Documentation

◆ experimental::AsyncNetworkImpl

friend class experimental::AsyncNetworkImpl

friend

Definition at line 815 of file INetwork.hpp.

◆ experimental::WorkingMemHandle

friend class experimental::WorkingMemHandle

friend

Definition at line 816 of file INetwork.hpp.

◆ GetGraphForTesting

Graph& GetGraphForTesting ( IOptimizedNetwork * optNetPtr )

friend

Definition at line 47 of file TestUtils.cpp.

 {
     return optNet->pOptimizedNetworkImpl->GetGraph();
 }

◆ GetModelOptionsForTesting

ModelOptions& GetModelOptionsForTesting ( IOptimizedNetwork * optNetPtr )

friend

Definition at line 52 of file TestUtils.cpp.

 {
     return optNet->pOptimizedNetworkImpl->GetModelOptions();
 }

◆ LoadedNetwork

friend class LoadedNetwork

friend

Definition at line 813 of file INetwork.hpp.

◆ Optimize

IOptimizedNetworkPtr Optimize	(	const INetwork &	inNetwork,
		const std::vector< BackendId > &	backendPreferences,
		const IDeviceSpec &	deviceSpec,
		const OptimizerOptions &	options = `OptimizerOptions()`,
		Optional< std::vector< std::string > &>	messages = `EmptyOptional()`
	)

friend

Create an optimized version of the network.

Parameters

network	INetwork description of the network to be optimized.
backendPreferences	The choice of the backend ordered by user preferences.
deviceSpec	DeviceSpec object as queried from the runtime. See IRuntime::GetDeviceSpec()
messages	If there are failures or warnings a string describing same will be added to the vector
options	OptimizerOptions object with optimizer configuration options

Returns: An IOptimizedNetworkPtr interface to the optimized network, throws an exception derived from armnn::Exception if process fails.

Definition at line 1680 of file Network.cpp.

 {
     ARMNN_LOG(debug) << options.ToString();
 
     // Enable profiling
     auto profiler = inNetwork.pNetworkImpl->GetGraph().GetProfiler();
     ProfilerManager::GetInstance().RegisterProfiler(profiler.get());
     profiler->EnableProfiling(options.m_ProfilingEnabled);
 
     ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer");
     if (backendPreferences.empty())
     {
         throw InvalidArgumentException("Invoked Optimize with no backends specified");
     }
 
     if (options.m_ReduceFp32ToFp16 && options.m_ReduceFp32ToBf16)
     {
         throw InvalidArgumentException("BFloat16 and Float16 optimization cannot be enabled at the same time.");
     }
 
     // Ensure TensorInfo is set on all output slots of ConstantLayers in the graph
     inNetwork.pNetworkImpl->GetGraph().VerifyConstantLayerSetTensorInfo();
 
     std::unique_ptr<Graph> graph = std::make_unique<Graph>(inNetwork.pNetworkImpl->GetGraph());
 
     auto optNet = IOptimizedNetworkPtr(new IOptimizedNetwork(std::move(graph), options.m_ModelOptions),
                                        &IOptimizedNetwork::Destroy);
 
     IOptimizedNetwork* optNetObjPtr = optNet.get();
 
     // Get the optimized graph
     Graph& optGraph = optNetObjPtr->pOptimizedNetworkImpl->GetGraph();
 
     if(options.m_shapeInferenceMethod == ShapeInferenceMethod::InferAndValidate)
     {
         // Infer the tensor infos for all output slots. Throws an exception on failure
         optGraph.InferTensorInfos();
     }
 
     // Perform AddBroadcastReshapeLayer optimisation
     using namespace optimizations;
     Optimizer::Pass(optGraph, MakeOptimizations(AddBroadcastReshapeLayer()));
 
     if(options.m_shapeInferenceMethod == ShapeInferenceMethod::ValidateOnly)
     {
         // Validate the tensor infos for all output slots. Throws an exception on failure
         optGraph.InferTensorInfos();
     }
 
     // Perform optimisation passes
     Optimizer::Pass(optGraph, MakeOptimizations(SquashEqualPermuteSiblings(),
                                                 SquashEqualTransposeSiblings(),
                                                 SquashEqualReshapeSiblings(),
                                                 OptimizeInversePermutes(),
                                                 OptimizeInverseTransposes(),
                                                 MovePermuteUp(),
                                                 MoveTransposeUp(),
                                                 PermuteAsReshape(),
                                                 TransposeAsReshape(),
                                                 OptimizeConsecutiveReshapes(),
                                                 RedirectMembersToConstantInputs(),
                                                 FoldPadIntoConvolution2d(),
                                                 FoldPadIntoDepthwiseConvolution2d(),
                                                 FoldPadIntoPooling2d(),
                                                 PermuteAndBatchToSpaceAsDepthToSpace(),
                                                 TransposeAndBatchToSpaceAsDepthToSpace(),
                                                 FuseBatchNormIntoConvolution2DFloat32(),
                                                 FuseBatchNormIntoConvolution2DFloat16(),
                                                 FuseBatchNormIntoDepthwiseConvolution2DFloat32(),
                                                 FuseBatchNormIntoDepthwiseConvolution2DFloat16()));
 
     // If Fp32 to Fp16 optimization is set convert Fp32 network to Fp16
     if (options.m_ReduceFp32ToFp16)
     {
         ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_ReduceFp32ToFp16");
         Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToFp16Converter()));
         Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));
     }
 
     // If Fp32 to Bf16 optimization is set convert Fp32 network to Bf16
     // Convert input of Convolution2d and FullyConnected from Fp32 to Bf16
     // Only Constant weight of Convolution2d and FullyConnected are converted from Fp32 to Bf16
     if (options.m_ReduceFp32ToBf16)
     {
         ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_ReduceFp32ToBf16");
         Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToBf16Converter()));
     }
 
     // Initialize backend settings
     BackendSettings backendSettings(backendPreferences, deviceSpec);
     if (backendSettings.GetAvailablePreferredBackends().empty())
     {
         std::stringstream failureMsg;
         failureMsg << "None of the preferred backends " << backendPreferences
                    << " are supported. Current platform provides " << backendSettings.m_SupportedBackends;
         ReportError(failureMsg.str(), messages);
         throw InvalidArgumentException(failureMsg.str());
     }
 
     // Create a map to temporarily hold initialized backend objects
     TensorHandleFactoryRegistry tensorHandleFactoryRegistry;
     BackendsMap backends = CreateSupportedBackends(tensorHandleFactoryRegistry, backendSettings);
 
     // Assign an available backend to each layer
     Graph::Iterator firstLayer = optGraph.begin();
     Graph::Iterator lastLayer  = optGraph.end();
     OptimizationResult assignBackendsResult = AssignBackends(optNetObjPtr->pOptimizedNetworkImpl.get(),
                                                              backendSettings,
                                                              firstLayer,
                                                              lastLayer,
                                                              messages);
     if (assignBackendsResult.m_Error)
     {
         // Failed to assign a backend to each layer
         throw InvalidArgumentException("Failed to assign a backend to each layer");
     }
 
     Optimizer::Pass(optGraph, MakeOptimizations(OptimizeInverseConversionsFp16(),
                                                 OptimizeInverseConversionsFp32()));
 
     // Apply the backend-specific optimizations
     OptimizationResult backendOptimizationResult = ApplyBackendOptimizations(optNetObjPtr->pOptimizedNetworkImpl.get(),
                                                                              backendSettings,
                                                                              backends,
                                                                              options.m_ModelOptions,
                                                                              messages);
     if (backendOptimizationResult.m_Error)
     {
         // Failed to apply the backend-specific optimizations
         throw InvalidArgumentException("Failed to apply the backend-specific optimizations");
     }
 
     // If the debug flag is set, then insert a DebugLayer after each layer
     // Doing this after applying the backend optimizations as they might have changed some layers
     if (options.m_Debug)
     {
         Optimizer::Pass(optGraph, MakeOptimizations(InsertDebugLayer()));
     }
 
     // Calculate the compatibility strategies for tensor handles
     OptimizationResult strategyResult = SelectTensorHandleStrategy(optGraph,
                                                                    backends,
                                                                    tensorHandleFactoryRegistry,
                                                                    options.m_ImportEnabled,
                                                                    messages);
     if (strategyResult.m_Error)
     {
         // Failed to apply the backend-specific optimizations
         return IOptimizedNetworkPtr(nullptr, &IOptimizedNetwork::Destroy);
     }
 
     // Based on the tensor handle strategy determined above, insert copy layers where required.
     {
         ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_AddCompatibilityLayers");
         optGraph.AddCompatibilityLayers(backends, tensorHandleFactoryRegistry);
     }
 
     // Convert constants
     {
         ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_ConvertConstants");
         Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));
         Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsHalfToFloat()));
     }
     return optNet;
 }

Member Data Documentation

◆ pOptimizedNetworkImpl

std::unique_ptr<OptimizedNetworkImpl> pOptimizedNetworkImpl

protected

Definition at line 828 of file INetwork.hpp.

Referenced by armnn::GetGraphForTesting(), IOptimizedNetwork::GetGuid(), armnn::GetModelOptionsForTesting(), IOptimizedNetwork::GetNumInputs(), IOptimizedNetwork::GetNumOutputs(), IOptimizedNetwork::GetProfiler(), armnn::Optimize(), IOptimizedNetwork::PrintGraph(), and IOptimizedNetwork::SerializeToDot().

The documentation for this class was generated from the following files:

include/armnn/INetwork.hpp
src/armnn/Network.cpp

Public Member Functions

Static Public Member Functions

Protected Member Functions

Protected Attributes

Friends

Detailed Description

Constructor & Destructor Documentation

◆ IOptimizedNetwork() [1/4]

◆ IOptimizedNetwork() [2/4]

◆ IOptimizedNetwork() [3/4]

◆ ~IOptimizedNetwork()

◆ IOptimizedNetwork() [4/4]

Member Function Documentation

◆ Destroy()

◆ GetGuid()

◆ GetNumInputs()

◆ GetNumOutputs()

◆ GetProfiler()

◆ PrintGraph()

◆ SerializeToDot()

Friends And Related Function Documentation

◆ experimental::AsyncNetworkImpl

◆ experimental::WorkingMemHandle

◆ GetGraphForTesting

◆ GetModelOptionsForTesting

◆ LoadedNetwork

◆ Optimize

Member Data Documentation

◆ pOptimizedNetworkImpl