Bibliotecas escritas em Cuda

instant-ngp

Primitivas de gráficos neurais instantâneos: NeRF extremamente rápido e muito mais.
  • 13.4k
  • GNU General Public License v3.0

deep-high-resolution-net.pytorch

O projeto é uma implementação oficial do nosso artigo CVPR2019 "Aprendizado profundo de representação de alta resolução para estimativa de pose humana".
  • 4.1k
  • MIT

cub

Primitivas cooperativas para CUDA C++. (pela NVIDIA).
  • 1.5k
  • BSD 3-clause "New" or "Revised"

cugraph

cuGraph - Biblioteca de análise de gráficos RAPIDS.
  • 1.3k
  • Apache License 2.0

blocksparse

Kernels de GPU eficientes para multiplicação e convolução de matriz esparsa em bloco.
  • 948
  • MIT

k2

Algoritmos FSA/FST, diferenciáveis, com compatibilidade PyTorch.
  • 927
  • Apache License 2.0

nv-wavenet

Implementação de referência da inferência de wavenet autorregressiva em tempo real.
  • 700
  • BSD 3-clause "New" or "Revised"

nvParse

Analisador CSV rápido baseado em GPU.
  • 550
  • Apache License 2.0

instant-ngp-Windows

Primitivas de gráficos neurais instantâneos: NeRF extremamente rápido e muito mais.
  • 458
  • GNU General Public License v3.0

nccl-tests

Testes NCCL.
  • 436
  • BSD 3-clause "New" or "Revised"

MegBA

MegBA: uma biblioteca distribuída baseada em GPU para ajuste de pacote em larga escala.
  • 368
  • Apache License 2.0

raft

O RAFT contém algoritmos e primitivos fundamentais amplamente usados ​​para ciência de dados, grafos e aprendizado de máquina. (por rapidsai).
  • 278
  • Apache License 2.0

dietgpu

Implementação de GPU de um codificador e decodificador de entropia ANS (sistema numeral assimétrico) generalizado rápido, com extensões para compactação sem perdas de tipos de dados numéricos e outros em aplicativos HPC/ML.
  • 247
  • MIT

TorchPQ

Pesquisa aproximada do vizinho mais próximo com quantização de produto na GPU em pytorch e cuda.
  • 173
  • MIT

Lantern

  • 163
  • BSD 3-clause "New" or "Revised"

RWKV-CUDA

A versão CUDA do modelo de linguagem RWKV (https://github.com/BlinkDL/RWKV-LM).
  • 113

cuhnsw

Implementação CUDA do algoritmo Hierarchical Navigable Small World Graph.
  • 88
  • Apache License 2.0

CUB

ESTE REPOSITÓRIO FOI MOVIDO PARA github.com/nvidia/cub, QUE É AUTOMATICAMENTE ESPELHADO AQUI..
  • 71
  • BSD 3-clause "New" or "Revised"

array-language-comparisons

Uma comparação de linguagens e bibliotecas de matrizes: APL, J, BQN, Q, Julia, R, NumPy, Nial, Futhark, SaC e ArrayFire.
  • 60
  • MIT

mish-cuda

Função de ativação Mish para PyTorch (por JunnYu).
  • 48
  • MIT

rocm-examples

  • 39
  • MIT

xgboost-node

Execute o modelo XGBoost e faça previsões em Node.js.
  • 33
  • GNU General Public License v3.0

CUDA-Guide

CUDA Guide.
  • 29

kobra

Mecanismo de jogo orientado para pesquisa explorando técnicas de renderização de última geração (por vedavamadathil).
  • 21

CryptoGPU

Análise de preços de criptomoedas.
  • 16

LSQR-CUDA

Esta é uma implementação LSQR-CUDA escrita por Lawrence Ayers sob a supervisão de Stefan Guthe do instituto GRIS na Technische Universität Darmstadt. A biblioteca LSQR foi criada por Chris Paige e Michael Saunders.
  • 11
  • MIT

SBNN

Rede neural binarizada singular baseada em operações de bit de GPU (consulte nosso documento SC-19).
  • 10
  • GNU General Public License v3.0

GCGT

Código-fonte do artigo: Compressed Graph Traversal baseado em GPU.
  • 7
  • MIT

FirstCollisionTimestepRarefiedGasSimulator

Este simulador calcula todas as interseções possíveis para um intervalo de tempo muito pequeno para um modelo de partícula.
  • 2

DOKSparse

tensores DOK esparsos na GPU, pytorch.
  • 1
  • MIT