smaug_docs/doxygen_html/smv__softmax__op_8cpp_source.html

#include "smaug/operators/smv/smv_softmax_op.h"

#include "smaug/operators/smv/smv_kernels.h"

#include "smaug/utility/debug_stream.h"


namespace smaug {


void SmvSoftmaxOp::tile() {

    auto inputs = getInput(0);

    auto outputs = getOutput(0);

    const TensorShape& shape = inputs->getShape();

    if (shape.getStorageDim(1) >

        SmvBackend::SpadSize() / inputs->getDataTypeSize()) {

        assert(false && "For softmax, a single tile must fit in the local "

                        "scratchpad size!");

    }

    // We can only tile on the N dimension.

    int maxInputs =

            std::min(SmvBackend::SpadSize() / inputs->getDataTypeSize() /

                             shape.getStorageDim(1),

                     shape[0]);

    TensorShape tileShape(

            { maxInputs, shape[1] }, DataLayout::NC, SmvBackend::Alignment);

    tiledTensors[0] = generateTiledTensor(inputs, tileShape, this);

    tiledTensors[1] = generateTiledTensor(outputs, tileShape, this);

}


void SmvSoftmaxOp::run() {

    TiledTensor& inputs = tiledTensors[0];

    TiledTensor& outputs = tiledTensors[1];

    assert(inputs.size() == outputs.size());

    setArrayMemTypeIfSimulating(

            smv::kEltwiseOpHw, "host_inputs", getInputsMemType());

    setArrayMemTypeIfSimulating(

            smv::kEltwiseOpHw, "host_results", getOutputsMemType());

    for (int i = 0; i < inputs.size(); i++) {

        dout(1) << "Input: " << i << ", output: " << i << "\n";

        Tensor* inputTile = inputs.getTileWithData(i);

        Tensor* outputTile = outputs[i];

        const TensorShape& inputShape = inputTile->getShape();

        const TensorShape& outputShape = outputTile->getShape();

        mapArrayToAccel(smv::kEltwiseOpHw, "host_inputs",

                        inputTile->data<float16>(),

                        inputShape.storageSize() * sizeof(float16));

        mapArrayToAccel(smv::kEltwiseOpHw, "host_results",

                        outputTile->data<float16>(),

                        outputShape.storageSize() * sizeof(float16));

        invokeKernel(smv::kEltwiseOpHw, smv_softmax_nc_vec_fxp,

                     inputTile->data<float16>(), outputTile->data<float16>(),

                     smv::spad0, smv::spad1, inputShape[0], inputShape[1],

                     inputShape.getPadding(1));

    }

    {

        auto stats = gem5::ScopedStats(

                stats::kTensorFinalStart, stats::kTensorFinalEnd);

        outputs.untile();

    }

}


}  // namespace smaug