Nvida 武汉站 会议心得 - 2025年3月11日

83 阅读2分钟

由于早上有事,我大约在11点到达会场。当时正在进行 Gemini 2.0 Flash 的演讲。

Gemini 2.0 Flash

讨论主要集中在Gemini的多模态功能上,虽然当时没有太大直观感受,会后我会进一步了解。

在Gemini介绍之后,四位专家讨论了海外创业机会。会议气氛活跃,我记录了以下要点:

  1. 数据监管:每个国家都有敏感话题。
  2. 理解海外市场:要符合主流趋势,理解像美国这样市场分散的国家,每个州都有不同。
  3. 客户获取成本:谷歌广告昂贵,社交媒体可以降低成本。
  4. 细分市场切入点:创业公司应专注于特定场景,比如Vidu最初专注于特定视频模型。
  5. 与北美媒体和资本互动:不仅仅是语言问题,还要与外国受众产生共鸣。
  6. 招聘:不要过于依赖硅谷大厂的工程师,薪资要求高。
  7. 产品能力:国内工程师的产品能力往往比国外更强。

下午,Sapient的一位专家深入探讨了技术内容,介绍了他们正在优化的大模型。如果要了解基本google Sapient 就能搜出来。

听起来很厉害,说是能模拟人脑的快慢思维,并且自己去创造新的知识,提到算法的时候现场比较吵,也听不太清楚。

然后开始路演,展厅的公司大致分为几类:

  1. AI代理相关:最为普遍。

    • 设计创意:AI用于设计行李箱、珠宝、家具等。我质疑是否真的有高需求,因为瓶颈似乎在制造而非设计。
    • MGX (MetaGPTX):类似于Cursor工具,听起来很强大,我会进一步研究。
    • Vidu:专注于视频模型。
    • 专用系统:为日本企业服务的多模态系统,会议纪要总结等。
  2. AI基础设施

    • DataScaler:类似于Browserbase,用于加速AI agent 快速获取互联网上的信息。用了一些优化的措施,比如边缘计算,CDN,甚至对TCP/IP 做了优化。这块属于我的本行了,下来会研究下。
  3. 海外云和支付服务:代表Google、AWS和海外支付服务的公司。

  4. 硬件

    • DeepSeek一体机:一体化设备。
    • 同声翻译机:将自己的声音翻译成不同语言。

觉得真正有干货的是MGX,DataScaler 还有 Sapient 提到的大模型