可拷,很刑!一种基于ChatGPT的高效吃瓜方式的探索和研究。

9,748 阅读14分钟

你好呀,我是歪歪。

最近掌握了一个新的吃瓜方式,我觉得还行,给大家简单分享一下。

事情说来就话长了,还得从最近的一次“工业革命”开始,也就是从超导材料说起。

8 月 1 日的时候 B 站这个视频引爆网络:

随后“常温常压下的超导材料”直接霸占了各个新闻媒体的头条,引爆了话题,点燃了股市。

当时我虽然不懂“超导材料”,但是我懂流量啊。

所以当天晚上我硬是蹭了一波,花了半小时,写了这篇文章《牛逼,室温超导材料!》

蹭到了 6k 多阅读,是我平时技术文章的三倍。

而我平时写一篇技术文章是按照一周的时间来准备的。

你算算这个投入产出比,你就懂为什么“蹭流量”且蹭成功的感觉是多么的爽了。

有一说一,写那篇文章的时候,我都没带脑子的,各种信息往里面塞就完事了。

写的时候,我在不断的刷 B 站视频下的评论,试图提炼出一些有用的消息。

但是评论太多了,上万条,而我又没有那么多时间去约定并提炼消息。

所以,有一个念头在我脑海里面一闪而过:我完全可以把评论扒下来,然后喂给 ChatGPT,让它来帮我提炼一波,不就行了吗?

但是这个念头真的就是一闪而过,因为如果我按照这一套下来,当天晚上肯定写不完,毕竟为了“蹭热度”熬夜,就有点不值当了。

现在热点过去了,随着最近各种官方的实验结论公布,第四次工业革命“超温超压超导时代”已经结束了。

但是那个一闪而过的念头这两天又冒出了。

怎么办呢?

既然它在脑海里面这么调皮,那就办了它吧。

找接口

既然要把评论扒下来,肯定是要找对应接口的嘛。

凭借我多年的冲浪经验,通过不断下拉评论区触发“正在加载”接口:

啪的一下,很快啊,我就找到了这样的接口:

然而很奇怪的是,这个接口,不管我拉多少次,它的入参是一模一样的:

但是每次请求返回的内容,也就是这个部分确实又是不一样的:

按理来说,这种一般都会采取偏移量分页的方式和后端交互,即每次请求的时候把当前请求获取到的最大的 ID 返回给后端,让后端从这个 ID 开始进行 limit 查询。

在 B 站的接口里面,我没有看到这样的相关信息,我能看到的是每次请求都一模一样。

反正就是很纳闷,左思右想没搞明白怎么回事。

于是我在网上搜素了一番,没有找到原因,但是找到了“过来人”之前使用过的另外一个接口:

api.bilibili.com/x/v2/reply/…" + videoId + "&mode=3&plat=1&next=" + i

其中 oid 是视频的 oldId,next 代表翻页。

关于为什么有一个 oid ,作为 B 站的老用户,我必须得多哔哔几句,显摆一下。

B 站早期的视频编号是av+数字,后来才改为了现在的bv+字母数字的组合。

但是这两个地址,其实指向的是同一个视频:

这可是老用户才知道的小秘密。

那么我是怎么拿到这个视频的 oid 呢?

很简单嘛,前面已经出现过了:

所以,当我对这个链接发起请求的时候,就能拿到对应视频下的评论:

api.bilibili.com/x/v2/reply/…

通过一个 for 循环,不断的变化 next 进行翻页,就能拿到这个视频下的评论。

写代码

接口搞定了,接下来就是写代码了。

什么,你不会以为我会直接把代码给你吧?

你这想法可真刑啊,代码写的越来越有判头了。

我只是给你推荐一个你可能会用到的小工具,用起来还是比较巴适的。

前面通过接口返回的数据,我们知道这个接口返回的是 json 数据。

当然,我们可以直接操作 json,但是一般来说我更习惯把 json 转对象。

然而,这个 json 字符串一层又一层的,格式化之后能有 2w 多行,处理起来特别麻烦:

巧了,我刚好知道一个网站干这个事情特别的厉害。

www.bejson.com/json2javapo…

我直接把整个 json 串扔进去,它就帮我生成了对应的 Java 类实体对象。

好家伙,55 个对象,这代码提交量蹭蹭上涨啊。

反正我只是用了我需要的三个类:Replies、Member、Content。

把 Json 转化为对象之后,就看你自己关注的是什么信息了。

比如我就关注这几个信息,在代码编写完成之后,发起调用,在控制台就能输出这些信息:

System.out.println("用户名称:" + repliesObj.getMember().getUname() + ",回复内容:" + repliesObj.getContent().getMessage() + ",点赞数:" + repliesObj.getLike() + ",评论数:" + repliesObj.getRcount() + ",评论时间:" + new Date(Long.parseLong(repliesObj.getCtime() + "000")));

但是这个时候出现了一个很奇怪的点,数据不知道怎么的,就跑到了我的数据库里面。

反正就特别神奇吧,甚至还按照点赞数给我排好了序。

有了数据,接下来的事情,我们为什么不问问神奇的 ChatGPT 呢?

开始你的表演

当我兴致勃勃的按照点赞数排序,把前 100 的评论都喂给 ChatGPT 之后:

它说,我的话太多了,拒绝回答我的问题:

这玩意你就想难住歪师傅?天真。

于是,我先喂给了它这段话:

然后,分了四段喂给它了评论,并让它开始给我分析:

一眼望去,感觉还行,至少是结合了材料在进行回答,没有胡言乱语,试图糊弄歪师傅。

于是,我又让它站在“超导专家”的角度对这些评论进行了分析,回复的内容也还说的过去:

它的最后一段话,甚至还真的和这次事件挺吻合:

总体来说,作为超导专家,我会强调科学研究的严谨性、准确性和透明性。超导领域的成果对科学、技术和社会都具有重要意义,因此在任何宣称超导成果的情况下,都应该遵循科学方法和伦理准则,确保准确性和可靠性。同时,科学传播也应该平衡信息的准确性和公众的期望,以避免误导和不必要的炒作。

然后,我定点分析了点赞最高的前几名评论。

首先从数据上来看,点赞数最高的是这个评论:

于是我问它怎么看待这个评论:

在我给它简述了陈睿和 B 站的关系之后,它给出了这样的回答:

接着,我分析了点赞数第二的评论:

看到这个回答的事情,其实我是有一丝丝的震惊的。

因为我甚至都没看懂这个隐喻:

评论者使用了隐喻,将超导材料比作一片脆弱的蝴蝶翅膀,通过这种比喻,强调了超导材料的微弱和脆弱性质

我之前看到这个评论的时候只是想起了蝴蝶效应,但是经过它这么一提醒,好家伙,确实是一个隐喻。

接着,我还让它给我分析了这个评论:

最后,我还发出了一个灵魂疑问:

当它吐出这个回答的时候,我确信我在评论区是没有注意到这个评论的。

于是在数据库里面找了一下,找到了。

确实,它没有乱说,这个评论是我喂给它的:

因为只有 94 个点赞,所以可能分页比较靠后,我在页面没有翻到。

呃呃呃~

这个评论,确实好笑。

回忆杀

你猜我这里为什么要把 videoId 作为一个参数传递进来呢?

因为通过分析 B 站超导视频的评论区,我成功地赋能了自己的能力。现在,只需要在不同视频中更换那串神秘的视频 ID,我就能够运用我的抓手,轻松地对标不同评论区的特点,将精华沉淀下来,实现信息的对齐与拉通。

这不仅是一种小步快跑的策略,更是一种颗粒度的操作,通过组合拳的方式,倒逼自己不断强化认知,实现价值的转化。

通过这个黑科技,在这个快节奏的互联网世界里,我能够快速响应各种信息,将其转化为有意义的洞察力。

不论是在哪个领域的视频,我都能够以小步快跑的方式,将信息的精髓抓取,实现对价值的转化。

现在我把这套组合拳教给你,希望你能活学活用。

比如,我给你举个例子。

这是小破站的“入站必刷”视频:

www.bilibili.com/v/popular/h…

前两个视频,一个是才浅的“黄金面具”,一个是何同学的“苹果电脑”,巧了,我都看过。

黄金面具的 oid 是 715024588。

苹果电脑的 oid 是 797663148。

在才浅,黄金面具的评论区,按照点赞数排序,是这样的:

又看到了一个我们熟悉的 ID,一个类似的评论内容:

石锤了,小陈四处水经验。

在何同学,苹果电脑的评论区,按照点赞数排序,是这样的:

排名第一的,是何同学自己的求三连评论。

排名第二的,看起来像是一个乱码,我不知道为什么,于是我去评论区实地考察了一下:

看到这个评论的瞬间,我就心领神会了。

这个笑脸,何同学在这个视频快结束的时候说了一句:

如果你使用的是支持面容识别的iPhone,那么每当你打开面容ID及密码,就会看到一个笑脸,那是一个来自1984年的微笑

这文案,是真的吊,一句话把人文情怀拉满了。

好吧,那我就还是给你粘出来,让你直接“现原形”:

在必刷视频里面,我还看到了这个视频,瞬间思绪被拉回了青春躁动的学生时代:

它的 oid 是 902007,很短,代表它有点历史了。

可能很多朋友都不明白为什么我会被这个视频的封面给抓住眼球,没关系,每代人有每代人的回忆。

我去扒了一下这个视频评论,点赞最高的评论有近 10w:

我仔细的阅读了一下这个评论,突然就有点笑不出来了:

视频是 2014 年发的,这个评论是 2017 年写的。

2017 年,梁逸峰同学,大学一年级,因为这个视频带来的相关恶搞信息,被校园欺凌了很长一段时间。

当然,除了上面这些视频之外,还有何同学的入坑之作:

我又重温了一遍。

再次看到这个画面的时候,虽然这是 2019 年的视频,虽然已经过去了 4 年有余的时间,虽然我已经使用上了 5G 网络,切身体会到了视频里面的速度,但是我还是按捺不住的震撼,正如我当年第一次看到这个视频一样的震撼。

同样的,我把评论区喂给了 ChatGPT,让它选出了最有意思的一条评论:

我们只有借助“后视镜”的方法,把自己置身于未来的可能性之中,才能理解技术对当下的意义。

在这个视频里面,何同学在探索“5G 有什么用”这个问题的时候,苦苦不得其道。

于是突发奇想,为什么不站在 2019 年,查询一下当年人们对于 4G 的看法呢?

于是,就有了这个关于“后视镜”的评论。

荒腔走板

最近有个句子很火,叫做“命运的齿轮开始转动”。

我在前面提到了一个 UP 主叫做“才疏学浅的才浅”,在 2021 年的时候,他因为制作“黄金面具”而被各大官媒点名表扬,各路群众看了他的视频之后也是纷纷竖起了大拇指。

这张图片,就是博主和他的黄金面具的合影:

但是在这之前,其实我就知道他。

他 2019 年的一个视频,还原《刺客伍六七》里面的兵器,魔刀千刃。

当年我看的时候正在吃饭。

当灯一关,刀一亮的那一刻,真的震撼到我了,膝盖不由自主的一软:震撼,每一根寒毛都体会到了难以描述的震撼。

在被官媒点名表扬之前,只能说在 B 站这个神奇的网站上有一席之地。

当他以正面的形象出现在人民日报、央视新闻以及各大官媒的报道中的时候,他就出圈了。

也许在其他人的眼里,他“命运的齿轮开始转动”。

但是在我的眼里,从他过往的优质视频中,他对于手工的那份专注和执着,他其实早就准备好了,官媒在任何时刻点名,他都能随时站出来。

他命运的齿轮一直在转,只不过因为黄金面具恰好被更多的人看到了而已。

还有何同学。

是因为前面提到的 5G 的视频火爆全网。

当我以“受益者”为关键词在数据库里面检索的时候,有人很多人都调侃说,何同学是“5G的最大受益者”。

也有人认为,因为 5G 的视频,何同学“命运的齿轮开始转动”:

当前,因为各个媒体铺天盖地的宣传,我也看到了他的视频,其实我当时的感觉就是:这小子真幸运呀,把握住了一个 5G 的风口,一下乘风而起。

当然了,这个视频质量本身就是非常的高,能看的出来是付出了无数的心血的。

然后我也看了他的过往的视频,质量一如既往的高。

之后的事情,你可能也知道了,他相继拍出了 600 万粉丝 ID 的合影照片、探索 80 年代的电脑、毕业视频、AirDesk等等这样的优秀的、引起广泛讨论的视频。

毕业之后,也成立了自己的工作室,一直在 UP 主的路上坚持前行。

5G 视频拍出来的时候,有人说何同学会昙花一现。

但是现在看来,那只是人家的起点而已。

“大鹏一日同风起,扶摇直上九万里”的起点。

他命运的齿轮也一直在转,只不过因为 5G 恰好被更多的人看到了而已。

学浅做出了黄金面具的那天,只是他“命运的齿轮”日常转动的一天。

他只是看到了三星堆的新闻,想到如果自己也能做一个,就当是一次与 3000 前年的工匠的对话。

在一个又一个夜晚,他拿着 1.8 公斤的锤子,对着金条锤下一次又一次。

何同学拍出 5G 的视频那一天,也只是他“命运的齿轮”日常转动的一天。

他只是想到了 5G 这个题材。然后拿出自己一如既往的热情和态度,拍摄出了这次的视频。

在一个又一个夜晚,他坐在电脑桌前,对着拍摄脚本一遍又一遍的修改。

总有一天,会站到大众的视野中,被人看见。

所以,我对于“命运的齿轮开始转动”这句话的理解就是:

不论是在黑暗中还是在阳光下,我们都要努力的让命运的齿轮一直转动下去,即使没人看到也没有关系,自己和身边的家人朋友,就是最重要的观众。至于其他人,随缘吧。

当然了,我还是希望能通过写文章的方式,让人能看到我有一如既往的努力让命运的齿轮一直在转动。

文章其实很累的。

为什么这么累我还一再压缩自己的空闲时间,强迫自己坚持写呢?

如果是真的喜欢,为什么还需要强迫自己呢?

如果这个过程,在我自己眼里都充满了无趣和劳累,为什么不去做别的事情呢?

也没有什么其他特别的原因吧。

因为,想涨粉啊。