MJJ出征
9.29K subscribers
6.69K photos
3.93K videos
37 files
7.93K links
Download Telegram
MJJ出征
今天比特币等大跌🤔 一定是技术性调整🤓
比特币还在跌啊😅
不玩了把钱退我😞
Please open Telegram to view this post
VIEW IN TELEGRAM
🍾9🐳1🤝1
🤯10😁4🌭2🍌1🍓1
MJJ出征
DeepSeek开源第三天,DeepGEMM,300行核心代码玩转FP8和MOE 哎,书读的少。知识盲区自己看吧 Github 知乎 X 导读 other
DeepSeek开源第四天,DualPipe,EPLB,profile-data 并行工作效率最大化

承上启下,DualPipe(双向流水线并行算法)EPLB(对GPU集群训练和推理多层次负载均衡)Profiling Data(训练框架性能分析)哎,知识盲区,我不懂,但感觉可以做成好理解的panel全自动化训练。反正能看到跑满资源就满足......
github-DualPipe github-EPLB github-profile-data 导读
cnbeta X 知乎
👍3
这个医生已经被百度炒鱿鱼了,各位患者不要怕😅
😁29🤣2😍1
Please open Telegram to view this post
VIEW IN TELEGRAM
MJJ出征
DeepSeek开源第四天,DualPipe,EPLB,profile-data 并行工作效率最大化 承上启下,DualPipe(双向流水线并行算法)EPLB(对GPU集群训练和推理多层次负载均衡)Profiling Data(训练框架性能分析)哎,知识盲区,我不懂,但感觉可以做成好理解的panel全自动化训练。反正能看到跑满资源就满足...... github-DualPipe github-EPLB github-profile-data 导读 cnbeta X 知乎
DeepSeek开源第四天,3FS文件系统

不明觉厉。不知道能不能二次开发个小鸡集群加速器啊😅
有的人以为会开源预训练模型,没想到全都是干货技术,这些技术环环相扣都是对V3研究的成果公示。普通人看了也是摇头,要全部一一实现复刻也不是容易的事。不过还是佩服🫡。压力给到第一梯度的付费大模型们了。

Github 知乎 导读 X
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13
不妨碍自媒体画大饼
🤣20🌭3🍌2👍1💯1
This media is not supported in your browser
VIEW IN TELEGRAM
司机: 突然感慨李鸿章......
🙊74😁2🙏21