AI资讯的个人主页 - 动态

AI 报道员 @掘金

·

东芝开发出AI将语音转换成简洁文字的技术

据日本共同社3月14日报道，日本东芝公司14日宣布，已开发出使用人工智能(AI)将会议及演讲的语音立即转换成易于阅读的文字，并通过字幕显示出来的技术。该技术能区别并删去发言者“嗯”、“那个”等停顿时夹杂的无意义的词语，转换成简洁的文章。该技术旨在方便听觉障碍人士理解信息。

目前通过使用AI的语音识别技术自动记录文字正在普及。然而由于是将说话者的原话转换成文字，对于通过视觉获得信息的听觉障碍者而言很难理解。

展开

今日新鲜事

AI 报道员 @掘金

·

6年前

【谷歌AI也会被难倒百年老图到底是鸭是兔？】这张图，画的是鸭子还是兔子？自从1892年首次出现在一本德国杂志上之后，这张图就一直持续引发争议。有些人只能看到一只兔子，有些人只能看到一只鸭子，有些人两个都能看出来。上周四，有位学者决定让没有心理活动的第三方看一下。然后就把这张图片给了谷歌AI，结果AI认为78%的概率是一只鸟，68%的概率是一只鸭子。

sports.sina.com.cn

展开

今日新鲜事

等人赞过

7

AI 报道员 @掘金

·

6年前

谷歌开源了一个分布式机器学习库 GPipe，这是一个用于高效训练大规模神经网络模型的库。

GPipe 使用同步随机梯度下降和管道并行进行训练，适用于由多个连续层组成的任何 DNN。重要的是，GPipe 允许研究人员轻松部署更多加速器来训练更大的模型，并在不调整超参数的情况下扩展性能。

展开

今日新鲜事

等人赞过

4

AI 报道员 @掘金

·

6年前

在Aravind眼科医院，技术人员拍摄每只眼睛的图像，然后算法评估DR和DME的图像。技术人员可以获得快速反馈，以确定是否需要将患者转诊给医生。

今日新鲜事

赞过

1

AI 报道员 @掘金

·

6年前

Facebook 开源增强版 LASER，可使用90多种语言

www.oschina.net

为了加速将自然语言处理（NLP）应用到更多的语言，Facebook 开源了增强版 LASER 库，成为第一个成功地与 NLP 社区分享的大型多语种句子表示工具。该工具目前可以使用90多种语言，涉及28种不同的字符表。

展开

今日新鲜事

等人赞过

4

AI 报道员 @掘金

·

6年前

最近，一款网页版深度学习模型编辑器面世了。不用下载任何客户端应用、不用装任何插件、甚至连数据集都不用下载，直接在网页端就可以搭建、训练、运行神经网络，甚至还是3D可视的。

等人赞过

1

17

AI 报道员 @掘金

·

6年前

【谷歌官宣！正式确认 TF 2.0 开发者预览版的发布】

www.infoq.cn

赞过

2

AI 报道员 @掘金

·

6年前

#一周AI# 裤子换裙子就问你 GAN 的这波操作秀不秀
把照片里的绵羊换成长颈鹿、牛仔长裤换成短裙。听起来有点不可思议，但韩国科学技术院和浦项科技大学的研究人员目前已实现了这一骚操作。他们开发的一种机器学习算法可在多个图像数据集上实现这种操作。其论文《InstaGAN: Instance-Aware Image-to-Image Translation》已被 ICLR2019 接收。
图像到图像的转换系统——即学会把输入图像映射到输出图像的系统——并非什么新鲜事。而这项新研究基于 CycleGAN 实现了实例级别的图像转换。转换图像和相应的实例属性集，同时保留语境。在这种情况下，它会生成对象分割掩码（属于同一对象的像素组），包含对象的边界，同时忽略诸如颜色之类的细节。via：百度AI

weibo.com

展开

赞过

1

AI 报道员 @掘金

·

6年前

#一周AI# IBM 开发指甲传感器使用 AI 监测病人健康状况
近日，IBM 开发了一种指甲传感器，可以检测握力并使用人工智能和机器学习来监测和分析人类健康和疾病发展情况。握力的强弱通常可以用来判断健康状况，除了判断帕金森症外，还可以衡量认知能力以及心脏健康状况。
据介绍，指甲传感器能够侦测到手抓取物体时指甲的变形，其灵敏度足以检测打开药瓶、转动钥匙以及写字等动作。之后将其收集的数据发送到智能设备，通过 AI 对此进行分析，可以检测到帕金森病的各种症状，例如震颤（开始缓慢的自主运动）和运动障碍（自主运动减少）。

weibo.com

展开

AI 报道员 @掘金

·

6年前

#一周AI# AI“另辟蹊径” 不靠肿瘤本身就能判断是否得肺癌
近日，来自美国凯斯西储大学（Case Western Reserve University）的研究人员开发出了一种识别肺癌的“另类”方法：通过训练算法，来识别肿瘤外部区域及附近血管的断层扫描（CAT）图像，从而让算法判断图像中肿瘤是否为恶性。
研究人员收集了2007-2013年期间来自两所机构290名患者的标准诊断非增强 CT 图像，来对图像中的结节进行组织病理学分析。在提取了结节数据之后，研究人员利用这些数据对机器学习算法进行训练，并使用另一个包含145名患者的测试集来进行验证。算法得出的结果将会与两名放射科医生识别的结果进行对比。
结果显示，机器学习算法能够以80%的准确率来判断结节是良性还是恶性，而作为对比的放射科医生准确率只有60%。来自：

weibo.com

展开

AI 报道员 @掘金

·

6年前

如何用JavaScript搭建神经网络？由Scrimba联合创始人带来官方圣诞礼物--19节免费的课程

1.课程介绍
2.我们的第一个神经网络
3.如何学习 - 传播
4.如何学习 - 结构
5.如何学习 - 层
6.使用对象
7.不止学数字
8.实践课程：计数器
9.归一化
10.实践课程：股价预测
11.多步预测
12.实践课程：学数学的循环神经网络
13.实践课程：数字检测器
14.实践课程：儿童书籍制作器
15.实践课程：情绪分析
16.RNN的输入与输出
17.实践课程：简明强化学习
18.实践课程：推荐引擎
19.最终思考

展开

等人赞过

15

AI 报道员 @掘金

·

6年前

【腾讯王者荣耀AI论文首次曝光：五AI王者局开黑与人类战队打成平手】王者峡谷可能马上要被AI支配了！腾讯刚刚发布的一篇论文显示，王者荣耀AI在不声不响间，又掌握了新的技能：组团开黑。

mp.weixin.qq.com

等人赞过

2

4

AI 报道员 @掘金

·

7年前

【使用AI技术合成高质量歌声】这是日本Techno-Speech&名古屋工业大学共同研发项目。

t.cn
搭载深层学习等AI技术，以特定的歌唱者约两个时间的歌声作为数据库进行分析，包括：声质、癖好、歌唱方式等内容。再通过合成就可以生成高质量的歌声。

展开

等人赞过

6

AI 报道员 @掘金

·

7年前

谷歌开源了一个 TensorFlow 的简化库 JAX。JAX 结合了 Autograd 和 XLA，专门用于高性能机器学习研究。GitHub 地址：

github.com

凭借 Autograd，JAX 可以求导循环、分支、递归和闭包函数，并且它可以进行三阶求导。通过 grad，它支持自动模式反向求导（反向传播）和正向求导，且二者可以任何顺序任意组合。

得力于 XLA，可以在 GPU 和 TPU 上编译和运行 NumPy 程序。默认情况下，编译发生在底层，库调用实时编译和执行。但是 JAX 还允许使用单一函数 API jit 将 Python 函数及时编译为 XLA 优化的内核。编译和自动求导可以任意组合，因此可以在 Python 环境下实现复杂的算法并获得最大的性能。

展开

等人赞过

5

AI 报道员 @掘金

·

7年前

谷歌在泰国启动医疗项目用AI筛查糖尿病性眼疾

www.cnbeta.com

周四谷歌表示，已经在泰国启动一项人工智能项目，旨在为导致永久性失明的糖尿病性眼疾病进行筛查。泰国的眼科筛查项目和谷歌在印度启动的项目类似，这些项目的初衷是推动大型科技公司利用人工智能新科技带来社会效益。

展开

赞过

1

AI 报道员 @掘金

·

7年前

PyTorch 是一个 Torch7 团队开源的 Python 优先的深度学习框架，提供两个高级功能：
强大的 GPU 加速 Tensor 计算（类似 numpy）
构建基于 tape 的自动升级系统上的深度神经网络
此版本的主要亮点包括JIT 编译、全新并且更快的分布式库与 C++ 前端等。

赞过

2

AI 报道员 @掘金

·

7年前

图深度学习库 DGL 正式开源了

github.com

赞过

1

AI 报道员 @掘金

·

7年前

百度云正式开源智能边缘计算平台 OpenEdge

www.oschina.net

OpenEdge 是一个开放的边缘计算平台，可将云计算能力拓展至用户现场，提供临时离线、低延时的计算服务，包括消息路由、函数计算、AI 推断等。OpenEdge 和云端管理套件配合使用，可达到云端管理和应用下发，边缘设备上运行应用的效果，满足各种边缘计算场景。

展开

赞过

3

AI 报道员 @掘金

·

7年前

DeepMind推出AlphaZero AI：国际象棋/围棋/将棋通杀

作为 AlphaGo 的最新迭代，DeepMind 又在 11 月 6 日发表的《科学》（Science）论文中，隆重介绍了 AlphaZero 。作为谷歌母公司 Alphabet 旗下的英国人工智能子公司，DeepMind 多年来一直致力于改进 Go AI 。2017 年的时候，前 AI 冠军 AlphaGo 正式退休，但在进一步修补之后，AlphaZero 又达到了新的顶峰。

AlphaZero 是一款能够从头学习围棋、象棋等棋子游戏的新型人工智能平台。在三款棋类比赛中，AlphaZero 将三款 AI 都挑落下马。

● Stockfish：国际象棋 AI 世界冠军；
● elmo：2017 年度世界计算机将棋锦标赛冠军；
● AlphaGo Zero：DeepMind 自家的围棋 AI，被誉为史上最强选手。

在仅仅获知有关游戏基本规则的情况下，AlphaZero 在成为人工智能大师之前，会先自己机型数百万场的对抗练习。

该 AI 初期会实施随机战术来取得胜利，但后续会通过‘强化学习’来试错，以逐步了解哪些策略是最有效的。

实测国际象棋需要 9 小时、将棋 12 小时、围棋 13 天，涉及 5000 个张量处理单元（TPU）。

作为参考，一套 TPU 每天可以处理超过 Google Photos 中的 1 亿+照片，所以 AlphaZero 对硬件处理性能的要求还是比较高的。

展开

赞过

1

AI 报道员 @掘金

·

7年前

微软昨天宣布开放 ONNX Runtime，这是一款用于 Linux，Windows 和 Mac 平台的 ONNX 格式的机器学习模型的高性能推理引擎。ONNX Runtime 允许开发人员在任何支持的框架中训练和调整模型，并在云端和边缘高性能运转。微软也正运用其在内部使用 ONNX Runtime 进行 Bing 搜索，Bing Ads，Office生产力服务等。

ONNX 为 AI 框架生态系统带来了互操作性，提供了可扩展计算图模型的定义，以及内置运算符和标准数据类型的定义。

ONNX 使模型能够在一个框架中进行训练并转移到另一个框架中进行推理。目前，Caffe2，Cognitive Toolkit 和 PyTorch 都支持 ONNX 模型。项目 GitHub 地址：

github.com

展开

等人赞过

4