我不是工程师
  • 首页
  • 碎碎念
  • Project
  • 归档
  • 分类
  • 标签
  • 书单
  • 关于
LLM推理与训练显存的计算方法

LLM推理与训练显存的计算方法

如何计算LLM训练和推理时所需要的显存占用。训练参数是模型参数的四倍。
2024-03-31
LLM
#工程实践 #LLM #NLP
Docker必备指南

Docker必备指南

Docker相关博文。
2024-03-16
工程实践
#Docker #工程实践
Git:常用指令汇总

Git:常用指令汇总

项目版本控制/协同开发必不可少的Git命令。
2024-03-16
Git
#工程实践 #Git

It's just business

近期工作所感。
2024-03-13
随笔
#随笔
最精简的搜索系统实现:倒排索引

最精简的搜索系统实现:倒排索引

一个非常精简的无机器学习搜索系统实现。
2024-03-10
搜索系统
#搜索系统
MiniBPE:探究Github上最简单的BPE实现代码

MiniBPE:探究Github上最简单的BPE实现代码

探究Github上的热门项目,Andrej Karpathy大神实现的最简BPE算法代码。
2024-03-09
LLM
#LLM #NLP #BPE
分布式训练:Distributed Data Parallel

分布式训练:Distributed Data Parallel

分布式数据并行的介绍。
2024-03-07
工程实践
#分布式训练 #DP #DDP
分布式训练:Data Parallel

分布式训练:Data Parallel

分布式训练的介绍。
2024-03-06
工程实践
#分布式训练 #DP #DDP
分布式训练初识:什么是分布式训练

分布式训练初识:什么是分布式训练

分布式训练的介绍。
2024-03-05
工程实践
#分布式训练 #DP #DDP
开发者必备技巧:VIM常用操作

开发者必备技巧:VIM常用操作

Vim的一些常用指令。
2024-03-03
工程实践
#工程实践 #Vim
1…56789…11

搜索

总访问量 次 总访客数 人
载入天数... 载入时分秒...