[240718] Hugging Face 发布 SmolLM 小型语言模型 | Windows Hyper-V 提权漏洞

325 阅读2分钟

SmolLM.png

Hugging Face 发布 SmoILM 小型语言模型

SmolLM 是 HuggingFaceTB 团队发布的小型语言模型(small language models),该系列有 3 个型号: 135M, 360M, and 1.7B parameters。

SmolLM 模型的语料库(SmolLM-Corpus)包括

  • Cosmopedia v2: 由 Mixtral 生成的教科书、博客文章、故事等 (28B tokens)
  • Python-Edu: The Stack 的教育性 Python 示例 (4B tokens)
  • FineWeb-Edu (去重后): FineWeb 的教育性网页样本 (220B tokens)

模型训练

135M 和 360M 型号的模型采用的训练数据量为 600B tokens,1.7B 型号的模型采用的训练数据量为 1T tokens。这些训练数据均来自 SmolLM-Corpus 。

模型训练.png

模型评估

在多个基准测试中均优于同等规模的其他模型,模型设计得很小,可以在各种硬件配置上本地运行。

模型评估.png

来源:
huggingface.co/blog/smollm

Windows Hyper-V 提权漏洞 -- CVE-2024-38080

CVE-2024-38080 是一个 Windows Hyper-V 提权漏洞,CVSS 评分为 7.8 。而 Windows Hyper-V 是微软开发的一种虚拟化技术,允许在单个物理计算机上创建和运行多个虚拟机,从而为用户提供安全和隔离的虚拟环境。

  1. 漏洞的危害
    具有用户权限的本地攻击者能利用 Hyper-V 在权限管理上的缺陷获取到系统权限,从而执行未经授权的操作或访问敏感数据。
  2. 漏洞修复情况
    官方已有该漏洞的完整解决方案,并发布了相应的补丁。
  3. 缓解措施
    建议用户尽快应用微软发布的安全更新,并遵循最佳安全实践来保护 Hyper-V 环境。这包括限制本地和远程访问、监控系统活动以及定期更新系统补丁。

来源:
msrc.microsoft.com/update-guid…




更多内容请查阅 : blog-240718


关注微信官方公众号 : oh my x

获取开源软件和 x-cmd 最新用法