ml-inference-optimization

1.3

142

ML inference latency optimization, model compression, distillation, caching strategies, and edge deployment patterns. Use when optimizing inference performance, reducing model size, or deploying ML at the edge.

inference-optimization

1.3

Rating

Installs

Machine Learning

Quick Review

No summary available.

LLM Signals

Description coverage-

Task knowledge-

Structure-

Novelty-

GitHub Signals

Last commit 0 days ago

Publisher

majiayu000

Skill Author

Loading SKILL.md…

Try onlineView on GitHub

Publisher

majiayu000

Skill Author

Related Skills

ml-pipeline

Jeffallan

6.4

sparse-autoencoder-training

zechenzhangAGI

7.6

huggingface-accelerate

zechenzhangAGI

7.6

moe-training

zechenzhangAGI

7.6

Try online

Improve

ml-inference-optimization

1.3

by majiayu000

142

inference-optimization

1.3

Rating

Installs

Machine Learning

Quick Review

No summary available.

LLM Signals

Description coverage-

Task knowledge-

Structure-

Novelty-

GitHub Signals

Last commit 0 days ago

Publisher

majiayu000

Skill Author

Loading SKILL.md…

Try onlineView on GitHub

Publisher

majiayu000

Skill Author

Related Skills

ml-pipeline

Jeffallan

6.4

sparse-autoencoder-training

zechenzhangAGI

7.6

huggingface-accelerate

zechenzhangAGI

7.6

moe-training

zechenzhangAGI

7.6

Try online