首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
澜舟孟子开源社区
掘友等级
算法工程师
|
澜舟科技
关注公众号「澜舟科技」,加入孟子开源社区,探索 NLP 前沿技术!澜舟科技(langboat.com)是一家认知智能公司,针对商业场景数字化转型、以自然语言处理为基础提供商业洞见类产品。2021年7月开源了孟子预训练模型。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
9
文章 9
沸点 0
赞
9
返回
|
搜索文章
赞
文章( 9 )
沸点( 0 )
2022 年中回顾|大模型技术最新进展
本文回顾了过去 12 个月以来,国内外大模型的发展趋势,包括百花齐放的国产大模型、新秀不断涌现的多模态模型、萌芽中的通用能力模型等等,并对大模型新应用、预训练框架等方面的进展进行了总结。
大模型轻量化实践路径
本文介绍了大模型轻量化技术背景,并分享了澜舟轻量化技术实践的 5 种路径,包括语言学知识增强、训练优化技术、模型压缩(蒸馏、剪枝和量化)、检索增强、多任务。
论文领读| 面向机器翻译的多语言预训练技术哪家强?最新进展一睹为快!
随着多语言预训练技术的进一步发展,多语言预训练为跨语言生成任务提供了优良的参数初始化,当多语言预训练之风吹向机器翻译领域,又将发生怎样有趣的化学反应?
NLP 论文领读|中文拼写纠错:怎样改善模型对 multi-typo 的纠正效果?
拼写纠错在诸多 NLP 任务和应用中都有重要作用,如 OCR、语音识别和搜索引擎等。在 NLP 任务和日常工作生活场景中,中文文本中的 typo 主要是拼音和字形相似导致的。
NLP 论文领读|文本生成模型退化怎么办?SimCTG 告诉你答案
重复生成是长文本生成中很常见的现象,论文中提出一种 SimCTG 方法,通过抑制模型生成不自然且包含不必要重复的文本,从而缓解文本生成模型的退化问题。
NLP 论文领读|改善意图识别的语义表示:有监督预训练中的各向同性正则化方法
意图识别(intent detection)是面向任务对话系统的核心模块,其标注数据较少,所以研究怎样用少量数据训练出一个优秀的意图分类器(few-shot intent detection
论文领读|合成数据的妙用:低成本构建高质量的大规模平行语料
人工构建高质量平行数据是一件成本巨大的事情,且几乎不可能满足目前神经机器翻译对数据量的需求。因此人们尝试通过自动构建平行数据的技术。该论文利用合成数据,对挖掘得到的平行数据中不完全对齐的数据进行替换。
论文领读|缺少有标注的数据集怎么训练文本检索模型?来看看 LaPraDoR怎么做的吧
如果你想训练一个文本检索模型,但是缺少有标注的数据集,那不妨来看看这篇论文,LaPraDoR 是一个无监督的文本检索模型,不依赖人工标注的数据集,可以在通用领域的大型数据集上进行训练。
从感知智能跨越到认知智能,NLP领域要做哪些创新?
认知智能到底要解决什么问题呢?实际上,认知智能要解决语言理解、问题求解、辅助决策和预测规划问题,它还有非常广泛的应用,从机器翻译到搜索、聊天、专家系统、广告、情感分析、对话、信息抽取、故障诊断、推理等
个人成就
文章被点赞
29
文章被阅读
26,704
掘力值
857
关注了
2
关注者
20
收藏集
0
关注标签
7
加入于
2022-06-13