
获得徽章 0
- 2025年07期《The AI Journal》半月刊重磅来袭!本期精选5个超实用开源项目,快来围观吧!
lerobot:由Hugging Face团队开发的一款端到端深度学习解决方案的开源机器人
🎵 youtube-music:一款用于播放和管理YouTube音乐的开源应用
📄 BabelDOC:一款用于文档翻译和双语比较的开源工具
📝 markitdown:微软出品的用于将文件和Office文档转换为Markdown的Python工具
🧠 minimind:便于学习的轻量级"大"语言模型
每个项目都独具特色,从机器人开发到文档处理,从音乐播放到AI模型训练,总有一款适合你!快来探索这些开源项目,开启你的AI之旅吧!juejin.cn
展开评论点赞 - Claudek现已启用网络功能!用户现可利用Claude进行在线搜索,以获取更为及时和精确的最新信息。
启用网络搜索功能后,Claude能够接入互联网,实时获取事件和资讯,从而提供更加准确和及时的回答。当Claude从网上搜集信息时,还会明确标注信息来源,便于用户快速验证。用户无需自行筛选搜索结果,Claude会自动筛选并以对话形式展示最相关的信息。这一新功能极大地扩展了Claude的知识库,使用户能够轻松获取最新动态和数据。
常见的应用场景包括:
销售团队:通过分析最新的行业趋势,更好地理解客户需求和痛点,从而提高成交率。
金融分析师:迅速获取最新的市场数据、财报信息和行业趋势,助力更精准的投资决策和更合理的财务模型构建。
研究人员:查找互联网上的原始资料,快速掌握前沿趋势,发现研究领域的空白,从而撰写出更具说服力的科研申请或文献综述。
购物者:比较不同渠道的商品功能、价格和用户评价,做出更明智的购物决策。
如何使用?目前,Claude的网络搜索功能已对美国地区的付费用户开放预览,免费用户及其他国家和地区的支持也将逐步推出。想要体验此功能,用户可前往个人设置中开启网络搜索功能,随后与Claude 3.7 Sonnet进行对话。当用户提出的问题适合使用网络搜索时,Claude会自动上网查询最新信息,并据此提供回答。展开评论点赞 - DeepSeek 开源周第二天: DeepEP
DeepSeek推出首个用于 MoE 模型训练和推理的开源 EP 通信库——DeepEP。
主要特点如下:高效、优化的all-to-all通信
通过 NVLink 和 RDMA 支持节点内和节点间通信
用于训练和推理预填充的高吞吐量内核
用于推理解码的低延迟内核
原生 FP8 调度支持
灵活的 GPU 资源控制,用于计算-通信重叠
🔗 GitHub:github.com
展开评论点赞 - 时隔4个月Anthropic PBC终于发布新Claude模型
2025年初的DeepSeek搅动了整个大模型领域,继 OpenAI o 系列、DeepSeek 之后,Claude 终于推出了自己的的 “深度思考” 模型:Claude 3.7 Sonnet。
Claude 3.7 Sonnet 也开启了 “深度思考”模式,不同的是它能够让用户决定让它思考多久,甚至同时进行多条思维路径,最后选出最佳答案,这让 AI 的思考更全面,也更可靠!
Claude 也能像 DeepSeek 那样 “展示自己的思维过程”,用户可以直接看到 AI 是怎么推理的。这让 AI 的“思考”变得更加透明,让我们看到 AI 是否为了 “迎合” 我们而调整自己的思维轨迹。
Claude 3.7 Sonnet在SWE-bench验证上实现了更强大的性能,比如软件工程方面,Claude 3.7 Sonnet 精度有了大幅度的提升(话说现在Claude 3.5 Sonnet 编程几乎是地表最强了),其他测试中也获得了很好的成绩。
PS:强归强,能不能更便宜一点呢?展开评论点赞 - DeepSeek 开源周第一天:FlashMLA 项目。
专门针对 Hopper GPU 优化了 MLA 解码内核,特别适合处理变长序列的场景,让 GPU 性能得到显著提升,提高推理效率。
主要优势:
- 在内存受限配置下可达到 3000 GB/s 的吞吐量
- 在计算受限配置下在 H800 SXM5 上可实现 580 TFLOPS
- 支持 BF16 数据格式
- 集成 64 块大小的分页 kvcache
地址:GitHub:github.com/deepseek-ai/FlashMLA展开等人赞过25