1025 早早聊 AI 资讯|英伟达被曝入局 PC 端 CPU!、Midjourney 新网站已上线、清华新研究解密信息茧房、4k 窗口长度就能读长文...

663 阅读11分钟

👉👉原文链接👈👈

「 最新活动 」

◇ 杭州 AI 峰会:AI 最后一公里,变现探索 🔗 Link

AI 浪潮,一起搞钱!早鸟有限,详情链接:xhkzr.xet.tech/s/2LquL0

「 行业动态 」

◇ 英伟达被曝入局 PC 端 CPU ! 🔗 News

英伟达计划竞争苹果的 ARM 芯片市场,设计基于 Windows 系统的 PC 端 ARM 架构 CPU,苹果的自研 CPU 成功带动市场增长,刺激微软等竞争对手寻求替代供应商,包括 AMD 也在积极开发 PC 端 ARM 芯片。尽管高通目前拥有 ARM 架构芯片的独家使用权,但在 2024 年到期后,英伟达和 AMD 将有机会进入市场。英伟达在 PC 端 CPU 领域表现出竞争力,尤其在 GPU 驱动兼容性方面具备优势,不同于高通。同时,高通也在 PC 端 CPU 开发中,预计将发布更多细节。

◇ Midjourney 新网站已上线测试版! 🔗 News

Midjourney 即将推出一个专注于基于浏览器的图像生成的新网站,旨在提供改进的图像和提示搜索、更好的图像浏览以及更快的图像查看功能。这个新网站允许用户直接在浏览器中生成图像,无需依赖外部平台,而与 OpenAI 的 DALL-E 3 相比,Midjourney 在图像质量和真实感方面表现更强,尽管 DALL-E 3 在简洁性和通过 ChatGPT 的准确提示方面更有优势。Midjourney 计划在未来推出 Midjourney v6,具有更高的图像质量和更好的文本输入跟踪功能,以与 DALL-E 3 竞争。这个转向基于浏览器的平台是 Midjourney 的增长机会。

◇ 清华新研究解密信息茧房! 🔗 News

信息技术和人工智能的迅速发展正在塑造智能社会,其中数字技术和智能推荐算法使媒体和平台更加个性化,但也可能导致信息茧房的出现,放大极端观点。清华大学的电子工程系与公共管理学院进行合作研究,利用大规模实证研究和信息动力学理论,揭示了网络媒体中信息茧房的运作方式和相变。分析了 5.7 亿用户行为数据,发现超过 57%的活跃用户在一年内经历了信息多样性的下降。研究提出了人-智自适应信息动力学模型,以理解信息茧房的形成,并为控制信息茧和创建负责任的推荐算法提供理论基础和实用方法。研究还突出了人工智能技术的双重性,即其可以缓解信息过载,但也可能导致信息同质化和社会分裂,提出了消除信息茧房的方法。

◇ 从华为的 AI 全景,看人工智能技术的演进与未来 🔗 News

人工智能技术自 20 世纪中叶以来经历了多次演进,从符号推理到深度学习和大数据时代。华为致力于全面的人工智能生态系统,将 AI 技术视为各行业创新的驱动力,通过硬件、AI 平台和开发工具支持各行业的智能化转型,尤其在大模型 AI 方面取得进展。人工智能广泛应用于不同领域,为创新和效率提供动力,为开发者提供了丰富的个人成长和就业机会,得到华为的支持。华为的愿景是通过 AI 技术构建智能世界,推动生活的重大变革,实现这一愿景需要政策支持、行业协作以及开发者的共同努力。

◇ 陈丹琦高徒与 Meta 联手,4k 窗口长度就能读长文 🔗 News

普林斯顿大学华人博士生引入了名为 MemWalker 的策略,该策略允许大型模型阅读长文本并回答问题,而无需额外训练。采用树状内存结构来处理长文本,能够进行推理和回答问题,而不只是总结文本。这一方法采用了“分而治之”的方式,将长文本拆分成更小的片段,以提高效率。研究人员基于 Stable Beluga 2 模型,进行了微调,构建了 MemWalker 的记忆树,包括叶节点和非叶节点,用于导航定位答案和推理。引入工作记忆机制有助于提高准确性,使准确率提高了约 10%,而这一过程完全是提示驱动的,无需额外的培训。虽然在理论上,MemWalker 可以处理任意长度的文本,但构建内存树的时间和空间复杂度会随文本长度呈指数级增长。

◇ LeCun 和 xAI 联创对呛,LLM 推理缺陷无解? 🔗 News

研究人员对大型语言模型的推理能力提出了批评,指出这是模型的一个显著弱点,其中包括 LeCun 和 Subbarao Kambhampati 教授等专家的观点。与此同时,一些人认为人类的推理能力也存在个体差异,这暗示 LLM 的局限性不一定否定其智力。讨论中涉及了提高人工智能推理能力的方法,特别是通过大型模型的研究。此外还反思了外部来源和文化对人类思维和语言的影响,以及挑战现有文学传统和声音影响的问题,强调了原创思想在文化进步中的潜在作用。

◇ 公开出售 GitHub star,「黑市」越来越明目张胆 🔗 News

GitHub 星数是评估项目受欢迎程度的指标,但 Wired 报道发现存在买卖星数的黑市,影响开发者社区。Wired 以加密货币购买了 50 颗 GitHub 星,揭示了这一市场的有效性,程序员和投资者常用假星来做决策。部分初创公司使用赠品来吸引 GitHub 星,但 GitHub Security 努力删除虚假星,但仍面临挑战。虚假指标问题不仅局限于 GitHub,社交媒体平台也普遍存在类似的作弊现象。

◇ 中国智慧城市 AI 市场前景 🔗 News

IDC 的报告指出,中国积极推动智慧城市发展,将人工智能技术纳入智慧城市平台的重要组成部分。然而 2022 年初,中国智慧城市人工智能平台市场遇到了一些发展瓶颈,市场规模为 53.2 亿元。这一瓶颈是由技术创新放缓以及人工智能在行业场景应用上的限制造成的,导致市场增长受到限制,主要技术提供商和行业解决方案提供商的竞争地位也受到了挑战。IDC 称,从 2023 年开始,随着大规模模型和生成式 AI 的兴起,智慧城市 AI 市场将迎来新的机遇,未来五年将进入大规模实际应用的关键阶段。当前市场竞争主要由商汤科技、科大讯飞等公司主导,前五家企业共占据市场份额的 42.4%。市场进一步分为计算机视觉、语音语义和机器学习等子市场,其中计算机视觉市场规模在 2022 年达到 39 亿元,与其他细分市场相比,机器学习市场的市场份额相对较低。

◇ 当中医碰上人工智能:舌诊准确率高达 94% 🔗 News

南澳大利亚大学(UniSA)和巴格达中等技术大学(MTU)的研究人员合作开发了一款人工智能系统,通过分析 50 名糖尿病、肾功能障碍和贫血患者的舌头图像,准确率高达 94%地诊断这三种疾病。这一系统利用传统的中医舌诊原理,通过观察舌头的特征来评估身体的生理和病理变化,为患者和医疗保健提供有关舌头颜色和疾病诊断的信息。这一技术还可以扩展到诊断其他 10 多种疾病,准确率高达 80%,通过智能手机图像实现远程疾病诊断,为人们提供了一种安全、便捷、无痛和经济的诊断方法。在中国,也有类似的中医舌诊软件应用程序,利用人工智能评估舌头图像并提供健康建议,这些工具基于庞大的中医术语数据库和舌象样本,用户发现它们方便准确地评估健康状况,而无需看医生。

◇ 三星全面投入 AI,欲成最智能 AI 手机 🔗 News

三星计划在即将发布的 Galaxy S24 系列旗舰智能手机中广泛整合人工智能技术,旨在使其成为有史以来最智能的 AI 手机之一,甚至超越谷歌在 Pixel 系列上提供的功能。这一系列预计将包括 AI 功能,如 ChatGPT 和 Google Bard,以支持内容和故事创作,同时还提到了改进的语音转文本功能。三星还将关注其虚拟助手 Bixby,力求提供更个性化和智能的用户交互。这一系列智能手机将利用更强大的 Exynos 和 Snapdragon 芯片在 AI 任务中取得优势,并预计将于明年 1 月发布。

◇ Matryoshka 扩散模型论 🔗 Twitter

文章讨论了扩散模型在生成高质量图像和视频方面的挑战,因为涉及到计算和优化问题。文中介绍了 Matryoshka Diffusion Models(MDM),这是一个端到端的框架,用于高分辨率图像和视频的合成。MDM 使用扩散过程,可以同时对多个分辨率的输入进行去噪,并采用了 NestedUNet 架构,将不同输入尺度的特征和参数嵌套在一起。MDM 支持从低分辨率到高分辨率的渐进训练计划,从而提高了高分辨率生成的优化。该方法在多个基准测试中表现出色,包括类别条件图像生成、高分辨率文本到图像以及文本到视频应用。值得注意的是,使用包含仅 1200 万张图像的 CC12M 数据集,可以训练高达 1024x1024 像素分辨率的单一像素空间模型,并具有强大的零样本泛化能力。

◇ QDAIF:提升 AI 生成内容的质量与多样性 🔗 Twitter

在主观领域,特别是创意写作中,AI 模型需要多样且高质量的输出的需求。QDAIF 方法,结合了 AI 反馈、通过语言模型交叉进行的大型模型的进化和质量与多样性度量,以增强 AI 生成内容的质量和多样性。QDAIF 在发现不同故事类型和结局,同时遵循预定义情节方面取得了成功,优于基线方法。人工评估证实了 QDAIF 在将 AI 反馈与人类反馈保持一致方面的有效性,从而产生更多样化和高质量的文本。此外,QDAIF 还应用于诗歌,包括识别流派和语气、提供质量评级以及以不同风格创造性地重新编写现有诗歌,表现优于基线方法。文章还讨论了使用 AI 反馈来增强分类多样性,如诗歌风格,以及发现标准 LLM 提示中的限制。

「 融资快讯 」

◇ 「小马智行」获沙特 1 亿美元投资 🔗 News

小马智行获得了来自沙特阿拉伯投资基金的 1 亿美元投资,作为新未来城项目的一部分。小马智行将与新未来城合作,在沙特阿拉伯建立合资公司,用作 Robotaxi 车队基地和自动驾驶生产研发中心。尽管获得新投资,小马智行的投前估值仍为 85 亿美元,公司成立于 2016 年,是中国估值最高的自动驾驶公司之一。最初专注于 Robotaxi 和 Robotruck 技术,如今已调整战略,将乘用车辅助驾驶系统整合其中以适应不断变化的行业动态。小马智行正在政府政策许可的部分城市进行自动驾驶汽车的测试和运营,并已获得中国四个主要城市的测试资格。

「 早点趣玩 」

◇ Loop Copilot: AI 驱动的音乐生成 🔗 Twitter

Loop Copilot 是一个人工智能音乐生成系统,可通过自然语言输入描述音乐需求,生成音乐并支持后续编辑和修改。它维护一个全局属性表以确保在多次编辑中音乐的连贯性,并支持高级音乐制作任务。这个系统创新地将自然语言和音乐生成相结合,提供了创作音乐的交互性方法。

「 技术阅读 」

◇ 从头开始构建高级 RAG 🔗 Link

  • LLM 路由
  • 检索重写/组合/融合