Topic: inference-optimization Goto Github

Some thing interesting about inference-optimization

👇 Here are 26 public repositories matching this topic...

aalbaali / liebatch

inference-optimization,Batch estimation on Lie groups

User: aalbaali

inference-optimization lie-groups batch-optimization g2o state-estimation

alibaba / bladedisc

inference-optimization,BladeDISC is an end-to-end DynamIc Shape Compiler project for machine learning workloads.

Organization: alibaba

compiler deep-learning machine-learning pytorch tensorflow inference-optimization mlir neural-network

amazon-science / mlp-rank-pruning

inference-optimization,MLP-Rank: A graph theoretical approach to structured pruning of deep neural networks based on weighted Page Rank centrality as introduced by the related thesis.

Organization: amazon-science

centrality-measures graph-theory inference-optimization machine-learning multilayer-perceptron neural-network pagerank pruning structured-sparsity weighted-pagerank

ankdeshm / inference-optimization

inference-optimization,A compilation of various ML and DL models and ways to optimize the their inferences.

User: ankdeshm

acceleration-model cnn-classification cuda cudf cuml inference-optimization nvidia-rapids python3 pytorch quantization

effrosyni-papanastasiou / constrained-em

inference-optimization,A constrained expectation-maximization algorithm for feasible graph inference.

User: effrosyni-papanastasiou

Home Page: https://hal.archives-ouvertes.fr/hal-03247163

expectation-maximization network-inference feasibility expectation-maximisation-algorithm inference-optimization

google / xnnpack

inference-optimization,High-efficiency floating-point neural network inference operators for mobile, server, and Web

Organization: google

neural-networks inference inference-optimization simd cpu multithreading matrix-multiplication convolutional-neural-networks convolutional-neural-network neural-network

goshaq / inference-optimizer

inference-optimization,A simple tool that applies structure-level optimizations (e.g. Quantization) to a TensorFlow model

User: goshaq

tensorflow tensorflow-models inference-optimization

grazder / template.cpp

inference-optimization,[WIP] A template for getting started writing code using GGML

User: grazder

cpp ggml deep-learning inference-optimization

harly-1506 / faster-inference-yolov8

inference-optimization,Faster inference YOLOv8: Optimize and export YOLOv8 models for faster inference using OpenVINO and Numpy 🔢

User: harly-1506

numpy-implementation object-detection openvino openvino-toolkit segmentation yolov8 image-processing inference-optimization numpy-arrays opencv

jiazhihao / taso

inference-optimization,The Tensor Algebra SuperOptimizer for Deep Learning

User: jiazhihao

deep-learning deep-neural-networks inference-optimization

keli-wen / agi-study

inference-optimization,The blog, read report and code example for AGI/LLM related knowledge.

User: keli-wen

code-examples demo inference-optimization llm train

kiritigowda / mivisionx-inference-analyzer

inference-optimization,MIVisionX Python Inference Analyzer uses pre-trained ONNX/NNEF/Caffe models to analyze inference results and summarize individual image results

User: kiritigowda

Home Page: https://kiritigowda.com/mivisionx-inference-analyzer/

openvx mivisionx onnx nnef caffe inference inference-engine inference-optimization amd amdgpu

ksm26 / efficiently-serving-llms

inference-optimization,Learn the ins and outs of efficiently serving Large Language Models (LLMs). Dive into optimization techniques, including KV caching and Low Rank Adapters (LoRA), and gain hands-on experience with Predibase’s LoRAX framework inference server.

User: ksm26

Home Page: https://www.deeplearning.ai/short-courses/efficiently-serving-llms/

batch-processing deep-learning-techniques inference-optimization machine-learning-operations model-acceleration model-inference-service model-serving optimization-techniques performance-enhancement scalability-strategies server-optimization text-generation large-scale-deployment serving-infrastructure

lmaxwell / armednn

inference-optimization,cross-platform modular neural network inference library, small and efficient

User: lmaxwell

Home Page: https://lmaxwell.github.io/posts/armednn---an-efficient-neural-network-inference-engine/

inference-engine neural-network eigen eigen3 lstm conv1d inference-optimization

manickavela29 / emotwitter

inference-optimization,OnnxRT based Inference Optimization of Roberta model trained for Sentiment Analysis On Twitter Dataset

User: manickavela29

avx2 avx512 bert-models cpu inference-optimization onnx onnxruntime quantization roberta-model sentiment-analysis

matteo-stat / transformers-nlp-multi-label-classification

inference-optimization,This repo provides scripts for fine-tuning HuggingFace Transformers, setting up pipelines and optimizing multi-label classification models for inference. They are based on my experience developing a custom chatbot, I’m sharing these in the hope they will help others to quickly fine-tune and use models in their projects! 😊

User: matteo-stat

huggingface nlp text-classification transformers huggingface-transformers fine-tuning inference-optimization multi-label-classification onnx onnxruntime

matteo-stat / transformers-nlp-ner-token-classification

inference-optimization,This repo provides scripts for fine-tuning HuggingFace Transformers, setting up pipelines and optimizing token classification models for inference. They are based on my experience developing a custom chatbot, I’m sharing these in the hope they will help others to quickly fine-tune and use models in their projects! 😊

User: matteo-stat

fine-tuning huggingface huggingface-pipelines huggingface-transformers inference-optimization named-entity-recognition ner nlp onnx onnxruntime

mit-han-lab / inter-operator-scheduler

inference-optimization,[MLSys 2021] IOS: Inter-Operator Scheduler for CNN Acceleration

Organization: mit-han-lab

Home Page: https://arxiv.org/abs/2011.01302

acceleration cnn inference-optimization parallelism

oulu-imeds / pytorch_bn_fusion

inference-optimization,Batch normalization fusion for PyTorch

Organization: oulu-imeds

batch-normalization deep-learning deep-neural-networks inference-optimization pytorch

piotrostr / infer-trt

inference-optimization,Interface for TensorRT engines inference along with an example of YOLOv4 engine being used.

User: piotrostr

deep-learning inference-optimization object-detection tensorrt

prabhath-r / enhancing-bert-for-nlp-tasks

inference-optimization,Improving Natural Language Processing tasks using BERT-based models

User: prabhath-r

bert-fine-tuning inference-optimization transformers

rapternmn / pytorch-onnx-tensorrt

inference-optimization,A set of tool which would make your life easier with Tensorrt and Onnxruntime. This Repo is designed for YoloV3

User: rapternmn

tensorrt onnxruntime onnx onnx-torch pytorch yolov3 inference-optimization darknet

sjlee25 / batch-partitioning

inference-optimization,Batch Partitioning for Multi-PE Inference with TVM (2020)

User: sjlee25

data-parallelism deep-learning dl-compiler dl-optimization inference-optimization tvm

wb-az / yolov8-image-detection

inference-optimization,YOLOV8 - Object detection

User: wb-az

average-precision computer-vision deep-learning inference-optimization live-streaming object-detection openvino-inference-engine openvino-toolkit optimization-algorithms pandas pytorch ray-tune ultralytics yolov8

zfturbo / keras-inference-time-optimizer

inference-optimization,Optimize layers structure of Keras model to reduce computation time

User: zfturbo

keras inference-optimization

zhliuworks / fast-mobilenetv2

inference-optimization,🤖️ Optimized CUDA Kernels for Fast MobileNetV2 Inference

User: zhliuworks

mobilenet-v2 cuda-kernels inference-optimization