AI椰青的个人主页 - 动态

2年前

FinGPT: Open-Source Financial Large Language Models FinGPT：开源金融大型语言模型

FinGPT是一个开源的金融领域大型语言模型，旨在通过数据为中心的方法和轻量级的低秩适应技术，提供可访问和透明的资源以开发金融语言模型。...

0

2年前

The paradox of diffusion distillation 扩散蒸馏的悖论

文章深入探讨了扩散模型如何通过将生成高维数据的复杂任务分解为简单的去噪任务来提高性能。尽管近期研究致力于减少所需的抽样步骤，甚至实现单步抽样，但作者分析了这种方法背后的直觉...

0

2年前

2024 关于AI的一张图和24个问题

Full Steam Ahead: The 2024 MAD (Machine Learning, AI & Data) Landscape 这是我们第十届年度报告，对数据...

0

2年前

The FinBen: An Holistic Financial Benchmark for Large Language Models

Abstract 摘要大型语言模型（LLMs）已经改变了自然语言处理（NLP）领域，并在多个领域展现出潜力，然而，由于缺乏深入评估和金融任务的复杂性，它们在金融领域的潜力...

0

2年前

Large Language Models in Finance: A Survey

这篇论文综述了大型语言模型在金融领域的应用，探讨了使用这些模型的策略、性能提升，并提出了一个决策框架以指导金融专业人士选择合适的模型。同时，也讨论了LLMs在金融中应用的局...

0

2年前

A Survey of Large Language Models in Finance (FinLLMs) 金融领域大型语言模型（FinLLMs）的综述

这篇论文综述了金融领域的大型语言模型（FinLLMs），探讨了其发展、技术、性能评估和面临的挑战。文中比较了不同FinLLMs的技术方法，提供了多个金融NLP任务的基准数据...

0

2年前

活动预告！
🚀 加入我们，在【大模型创业的趋势：走向与Infra的技术边界】研讨会，揭秘GPU边缘技术和HBM存储。深入交流AI创新与实践，与行业领袖一起探索未来！

时间：3/30上午，地点：线上。扫码报名，锁定未来科技的脉动！

技术交流圈

2年前

AI for Investment: A Platform Disruption AI在投资中的应用：平台颠覆

投资领域中，AI技术的应用正逐渐成为基金获取竞争优势的关键。随着自动化需求的增长，许多基金转向开发内部AI平台，以提高交易来源和洞察力。尽管第三方软件提供商存在，但它们在个...

0

2年前

赚取利息：AI金融科技工具

这篇文章讨论了生成式人工智能（Generative AI）在金融科技（Fintech）领域的应用和影响。文章指出，生成式AI已经开始在金融科技领域释放价值，提高效率，如Br...

0

2年前

Sora最近活动挺多的，奇绩的周末的活动希望从模型架构、数据、芯片Infra、产品、开源多个角度预测，分析留给产品和创业的机会
嘉宾背景：
对于模型 Saining Xie的大弟子；
英伟达视频生成的核心作者；
交互式游戏叙事鬼才；
华为芯片的天才少年从芯片角度分析Sora的成本变化；
HuggingFace开源生态

名额有限，欢迎扫码报名～

展开

大模型生态圈

2年前

#大模型日报#
大模型日报春节特刊来袭(目录节选)：
一.资讯
1️⃣陈丹琦团队新作：数据量砍95%，大模型性能更强了！Less is More
2️⃣斯坦福最强家务机器人ALOHA 2来了，成本不到20万，联手谷歌DeepMind，完全开源
3️⃣MIT、IBM 团队巧妙的 AI 方法来解决「蛮力」数学问题
4️⃣RAG还是微调？微软出了一份特定领域大模型应用建设流程指南
5️⃣春节大礼包！OpenAI首个视频生成模型发布，60秒高清大作，网友已叹服
6️⃣谷歌Gemini1.5火速上线：MoE架构，100万上下文
7️⃣突发！AI大牛Andrej Karpathy离开OpenAI
二.推特
1️⃣Akshay分享Thread：LLM如何工作，从条件概率开始
2️⃣微软Copilot上线开售：对任何人、任何地方、任何设备都可用
3️⃣1X机器人上线：全神经网络。全自动。全部1X速度
4️⃣Whisper API现在支持词汇和片段级的时间戳
5️⃣Lilian Weng分享文章《思考高质量人类数据》：高质量数据是现代数据深度学习模型训练的燃料
6️⃣谷歌深度学习Chollet：人们对LLM的观点现在总是走向两个极端
7️⃣LeCun被评TIME100影响力奖的三位获奖者之一
8️⃣DeepLearning 新课程：Amazon Bedrock无服务器应用的新短期课程
9️⃣Altman：Openai现在每天生成约1000亿个单词，评论区嘲讽7 trillion芯片计划
🔟Elvis分享LLM代理概述：关于构建基于LLM的代理的关键发展、洞察和实用技巧
三.论文
1️⃣百万长度视频和语言上的世界模型与RingAttention
2️⃣数据工程：将语言模型扩展到128K上下文
3️⃣刺猬与豪猪：带有Softmax模仿的表达性线性注意力
4️⃣3D高斯新视觉时代：综述
5️⃣无需搜索达到国际象棋大师级水平
6️⃣OpenMathInstruct-1: 180万条数学指令微调数据集
7️⃣StableMask: 为仅有解码器的Transformer优化因果掩码
8️⃣Lumos：赋能多模态大语言模型与场景文本识别
9️⃣屏幕智能体：用于用户界面和信息图解析的视觉语言模型

展开

AGI交流圈

赞过

3

1

2年前

#大模型日报#
今日大模型日报：
1️⃣研究
1.CMU&ETH实现突破：机器狗点满敏捷值天赋，超高速穿越障碍，速度与安全兼备！
2.罕见！苹果开源图片编辑神器MGIE，要上iPhone?
2️⃣产业
1.王长虎：PixVerse 实测效果已超过 Pika，抖音经验让我们有足够优势
2.来生成式 AI 黑客马拉松赢取丰厚奖励，向世界展示你的才华！
3.华泰 | 海外科技：四巨头以云、广告、AI为主战场
3️⃣推特
1.奥特曼：GPT-4 在新年决心上起步缓慢，但现在应该会变得不那么懒惰了！
2.LlamaBot开源Discord 机器人：能够听取你的对话，记住它们，并在一个 Discord 服务器中回答你的问题
3.Natural-SQL-7B：新的、非常强大的 Text to SQL 模型
4️⃣论文
1.PokéLLMon: A Human-Parity Agent for Pokémon Battles with Large Language Models
2.Improving Reinforcement Learning from Human Feedback with Efficient Reward Model Ensemble
5️⃣产品
1.samwell.AI-通过 AI 改变学术写作的解决方案
2.Reducto AI-将复杂的非结构化文档转换为结构化输出
6️⃣HuggingFace&Github
1.SVD 1.1版本-模型本体缩小到4GB左右，同时提高了推理速度
2.IOPaint-图像修复工具
7️⃣投融资
1.2023年江苏省投融资报告丨一级市场发生融资事件1462个，智能制造行业最热；65家企业完成IPO，比去年下降20%
2.创投周报（1.29-2.4）
8️⃣学习
1.C++如何避免float误差？
2.AI Infra论文阅读之将流水线并行气泡几乎降到零

展开

2年前

#大模型日报#

2024年2月4日大模型日报：
1️⃣研究
1.击败OpenAI，权重、数据、代码全开源，能完美复现的嵌入模型Nomic Embed来了
2.浙大团队发布 75 页科学 LLM 调查，重点关注生物和化学领域，指出七个未来发展方向
2️⃣产业
1.大的要来了：谷歌Bard被曝将更名为Gemini，Ultra 1.0更强但收费、安卓App也会来
2.即使“杀不死”英伟达，OpenAI等数十家 AI 公司也要全力“围剿”它
3.2024年AI算力行业上市公司全方位对比(附业务布局汇总、业绩对比、业务规划等)
3️⃣推特
1.Rawdog：创造自然语言命令行界面，生成Python脚本来回答你的问题，在当前工作目录中自动执行它们
2.Hugging Chat Assistant：在Hugging Face Chat中仅需两次点击就能构建你自己的个人助手，创造定制版本的Huggingface Chat
3.Anaconda联创调侃：当人类真的创造出人工通用智能（AGI）时，它将被命名为Untitled14.ipynb
4️⃣产品
1.PROCESIO-面向企业的自动化平台
2.PICTORY-将博客文章转化为视频的工具
5️⃣HuggingFace&Github
1.MiniCPM-开源的系列端侧大模型
2.OLMo-开放语言模型的存储库
6️⃣投融资
1.从2019到2023年，ToB资本发生了哪些变化？
2.百页PPT，回顾VC/PE的2023
7️⃣学习
1.AI领域精选文章（2024年汇总版）！
2.2023年大语言模型智能体规划技术(LLM Agent Planning)研究进展汇总
最新综述更多信息，请查看飞书文档

🏻：

miracleplus.feishu.cn

展开

赞过

2

2年前

#大模型日报#

今日大模型日报：
1️⃣研究
1.大模型也有小偷？为保护你的参数，上交大给大模型制作「人类可读指纹」
2.阿里全新Agent玩转手机：刷短视频自主点赞评论，还学会了跨应用操作
2️⃣产业
1.A16Z 最新 AI 洞察｜2023 年是 AI 视频元年，2024 年还有这些难题需要解决
2.2B参数性能超Mistral-7B：面壁智能多模态端侧模型开源
3.亚马逊推出人工智能购物助手 TRufusJ
3️⃣推特
1.OpenBMB发布一系列边缘模型，包括接近Mistral 7B的2.4B基础模型
2.Nomic Embed：第一个完全开放的长文本嵌入器，超越OpenAI
3.Stutz分享在谷歌DeepMind的经历和反思：人工智能领域的发展速度令人难以置信
4️⃣论文
1.OLMo：加速语言模型科学研究
2.Dolma：用于语言模型预训练研究的三万亿 token 的开放语料库
3.FormalLLM：将正式语言和自然语言集成为可控的基于大语言模型的智能体
5️⃣产品
1.GPTGuard-保护数据隐私和安全的 AI 工具
2.Flipner AI - AI 写作工具
6️⃣HuggingFace&Github
1.MoE-LLaVA-新颖的 LVLM 训练策略
2.如何借助 AI 制作红包封面
7️⃣投融资
1.Generative AI Startups funded by Y Combinator (YC) 2024
2.2023年上海市投融资报告丨一级市场融资事件1197个，浦东新区占21%；46家企业IPO，共募资589亿元
8️⃣学习
1.大模型推理框架RTP-LLM对LoRA的支持
2.Richard Sutton ||智能决策器通用模型的探索
最新综述更多信息，请查看飞书文档

🏻：

miracleplus.feishu.cn

展开