MJJ出征
9.31K subscribers
6.66K photos
3.89K videos
37 files
7.9K links
Download Telegram
好评的🤓
👍44🤡2
Forwarded from Solidot
Google TurboQuant AI 压缩算法大幅减少大模型内存使用

2026-03-29 19:05 by 人猿泰山之英雄归来

Google 研究院发布了压缩算法 TurboQuant,能在大幅减少大模型内存占用的同时提高速度和维持精度。TurboQuant 旨在减小键值缓存的大小,被称为是储存重要信息减少再计算的“数字查找表(digital cheat sheet)”。大模型并不理解任何东西,它通过映射词元文本语义的向量去模拟对事物的理解。大模型的向量通常使用 XYZ 坐标进行编码,而实现 TurboQuant 压缩的系统将向量转换为笛卡尔坐标系的极坐标,向量被简化为两类信息:半径(核心数据强度)和方向(数据含义)。如果使用 XYZ 坐标编码向量,那么特定位置可以编码为“向东走 3 个街区,向北走 4 个街区”,采用笛卡尔坐标编码向量,那么同样的信息编码为“沿 37 度方向走 5 个街区” ,简化了空间节省了计算。Google 的早期测试显示,TurboQuant 在部分测试中实现了 8 倍的性能提升,内存占用减少到原来的六分之一,同时质量没有损失。实现 TurboQuant 算法将有助于降低 AI 模型的运行成本和内存占用,但也可能推动更复杂模型的出现,因此对将降低内存价格可能没有什么效果。

https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/
https://arxiv.org/abs/2504.19874

#Google
4👏2
贪小便宜是这样的
正价付费买不起,投机取巧玩合租😅
基本上玩中转的99%都是参水。中途换个模型,上下文丢失,直接影响你的结果偏差😏。(给你一种哦,好厉害,但是又达不到完美的效果。🤡)
为认知买单 🤌
https://x.com/i/status/2038293604897378815
Please open Telegram to view this post
VIEW IN TELEGRAM
😁32🤡1
This media is not supported in your browser
VIEW IN TELEGRAM
Telegram 官方宣称其数据中心(Data Center,简称 DC)主要分布在世界各地的 5 个区域,以保证全球访问速度。这 5 个 DC 编号为 DC1-DC5,
分布如下:
DC1 和 DC3 位于美国迈阿密,
DC2 和 DC4 位于荷兰阿姆斯特丹,
DC5 位于新加坡。
数据中心分布详情:
DC1 (迈阿密, 美国): 主要处理美洲部分区域数据。
DC2 (阿姆斯特丹, 荷兰): 处理欧洲及周边地区数据。
DC3 (迈阿密, 美国): 同样位于迈阿密,分担数据压力。
DC4 (阿姆斯特丹, 荷兰): 同样位于阿姆斯特丹,处理欧洲数据。
DC5 (新加坡): 主要处理亚洲区域的用户数据。
😁101🤣1
Media is too big
VIEW IN TELEGRAM
这是什么车太秀了
男子下车后,车自己开跑了!这是错误开启什么模式了呢?
👍4
Telegram 或将针对使用非官方客户端的用户发布安全警示

Telegram iOS 版官方应用的翻译字符串库中新增了一项安全提示,指出当对话方使用非官方客户端时,系统可能会向用户发送警告。该提示文本显示:
正在使用非官方的 Telegram 客户端—这可能会降低与该用户通信的安全性

此次更新可能与近期流行的第三方客户端“Telega”有关。该应用被指会将加密消息发送至俄罗斯服务器进行解密,从而面临数据被监管机构调取的风险。目前尚不确定该警告是针对所有第三方客户端,还是仅限于 Telegram 认为不安全的特定应用。
🐳6😁2💅2🍾1👨‍💻1