首页
首页
BOT
沸点
课程
直播
活动
AI刷题
NEW
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Q同学
掘友等级
学生
研究生在读,个人主页:https://jiexingqi.github.io/
获得徽章 9
动态
文章
专栏
沸点
收藏集
关注
作品
赞
1.7K
文章 1.6K
沸点 45
赞
1.7K
返回
|
搜索文章
Q同学
赞了这篇沸点
黄酒小菜有几碟
面向对象开发攻城狮
·
1月前
举报
jym福利兑换, 每天几点更新, 每天都是今日已抢光
赞过
分享
10
3
Q同学
学生
·
1月前
关注
论文笔记:Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling
导语 当一个大模型面对给定的算力,是应该更多的用于预训练还是推理?本文尝试回答这个问题。- 会议:Arxiv 2024 - 链接:[[2408.03314] Scaling...
1
评论
分享
Q同学
学生
·
1月前
关注
Open o1模型介绍(Learning to Reason with LLMs)
导语 本文主要整理和翻译自Open AI官网博客内容,用于了解Open AI官方对o1的描述和定位。综合了如下博客: https://openai.com/index/le...
1
评论
分享
Q同学
学生
·
1月前
关注
论文笔记:Tree of Thoughts: Deliberate Problem Solving with Large Language Models
大模型推理领域的思维链是一个常用的优化技巧,本文将其进行了拓展和一般化,考虑树结构的思维树,在解决复杂推理任务时表现出了远超一般思维链的性能表现。...
1
评论
分享
Q同学
学生
·
5月前
关注
新手小白装机记录
导语 今年5月份,我在淘宝上找人组装了一台游戏主机(12600kf+4060),主要用于玩游戏。那时候,配置是店铺提供的,机器也是他们组装好的,到了我这儿,只需要自己安装一...
3
4
分享
Q同学
赞了这篇文章
得物技术
9月前
关注
如何扩展大模型的上下文长度
本文将基于比较火的 Llama 2 大模型的结构介绍上下文长度的方法与挑战,然后探讨一些业界流行的上下文长度扩展的技术,最后给大家推荐下 KubeAI 大模型训练推理平台可...
7
1
分享
Q同学
学生
·
7月前
关注
Phi-3:手机上就能运行的强力语言模型
导语 phi-系列模型是微软研究团队推出的轻量级人工智能模型,旨在实现“小而精”的目标,能够实现在低功耗设备上例如智能手机和平板电脑上部署运行。截止目前,已经发布到了phi...
1
评论
分享
Q同学
学生
·
7月前
关注
Phi-2:小型语言模型令人惊人的能力
导语 phi-系列模型是微软研究团队推出的轻量级人工智能模型,旨在实现“小而精”的目标,能够实现在低功耗设备上例如智能手机和平板电脑上部署运行。截止目前,已经发布到了phi...
2
评论
分享
Q同学
学生
·
7月前
关注
高质量数据至关重要:phi-1.5论文笔记
导语 phi-系列模型是微软研究团队推出的轻量级人工智能模型,旨在实现“小而精”的目标,能够实现在低功耗设备上例如智能手机和平板电脑上部署运行。截止目前,已经发布到了phi...
3
评论
分享
Q同学
学生
·
7月前
关注
高质量数据is all you need:Textbooks Are All You Need论文笔记
导语 phi-系列模型是微软研究团队推出的轻量级人工智能模型,旨在实现“小而精”的目标,能够实现在低功耗设备上例如智能手机和平板电脑上部署运行。截止目前,已经发布到了phi...
4
评论
分享
Q同学
学生
·
7月前
关注
Llama 3问世:迄今为止的最强开源大语言模型
导语 最近Meta发布了其研发的第三代开源大语言模型Llama 3,并宣称Llama 3为迄今为止的最强开源大语言模型,本文对其进行简要学习记录。若想了解之前版本的Llam...
3
评论
分享
Q同学
赞了这篇文章
HuggingFace
开发者社区 @HuggingFace
·
7月前
关注
Hugging Face Transformers 萌新完全指南
欢迎阅读《Hugging Face Transformers 萌新完全指南》,本指南面向那些意欲了解有关如何使用开源 ML 的基本知识的人群。我们的目标是揭开 Huggin...
4
评论
分享
Q同学
学生
·
8月前
关注
CLIP论文笔记:Learning Transferable Visual Models From Natural Language Supervision
导语 会议:ICML 2021 链接:https://proceedings.mlr.press/v139/radford21a/radford21a.pdf 当前的计算机...
2
评论
分享
Q同学
学生
·
8月前
关注
ViT论文笔记:An image is worth 16x16 words- Transformers for image recognition
导语 会议:ICLR 2021 链接:https://arxiv.org/pdf/2010.11929.pdf 虽然Transformer架构已成为NLP任务的事实标准,但...
2
评论
分享
Q同学
赞了这篇文章
前端鲨鱼哥
前端 @外企
·
3年前
关注
最全的手写JS面试题
这是我参与更文挑战的第 1 天,活动详情查看:更文挑战 前言 本文整理了前端面试高频出现的手写源码相关的题目 其中有小编面试亲自遇到的也有其他同学帮忙补充的...
2.2k
171
分享
Q同学
赞了这篇文章
信鑫
Developer @BAT
·
1年前
关注
基于大模型 + 知识库的 Code Review 实践
基于私有化部署的开源大模型,结合内部知识库的 Code Review 实践,实现一个类似代码评审助手(CR Copilot)...
194
18
分享
Q同学
学生
·
12月前
关注
DAIL-SQL:LLM在Text-to-SQL任务中的详细评估
导语 本文聚焦于利用LLMs进行Text-to-SQL任务,并指出缺乏系统性基准测试限制了有效、高效和经济的LLM-based Text-to-SQL解决方案的发展。研究者...
5
4
分享
Q同学
学生
·
12月前
关注
EMNLP 2023精选:Text-to-SQL任务的前沿进展(下篇)——Findings论文解读
导语 本文记录了今年的自然语言处理国际顶级会议EMNLP 2023中接收的所有与Text-to-SQL相关(通过搜索标题关键词查找得到,可能不全)的论文,共计12篇,包含5...
2
2
分享
Q同学
学生
·
12月前
关注
论文笔记:SQLPrompt: In-Context Text-to-SQL with Minimal Labeled Data
导语 本文提出了SQLPrompt,通过创新的Prompt设计、基于执行一致性的解码策略,以及混合不同格式的Prompt和不同LLMs输出的方式,提高了LLM在Few-sh...
4
评论
分享
Q同学
学生
·
12月前
关注
QPL:一种新型的Text-to-SQL任务中间表示形式
导语 本文提出了一种叫做Query Plan Language (QPL)的语言,用来将复杂SQL语句分解为更加简单的子语句。QPL具有以下优势:1)可以转述为简单问题,从...
4
评论
分享
下一页
个人成就
优秀创作者
文章被点赞
2,138
文章被阅读
319,299
掘力值
10,571
关注了
32
关注者
228
收藏集
1
关注标签
12
加入于
2021-12-01