看了Bullshit Generator之后,我发现狗屁不通领域竟然大有可为

303 阅读7分钟

这是我参与2022首次更文挑战的第21天,活动详情查看:2022首次更文挑战

本篇内容改编自我几近废弃的微信公众号,是我为数不多的早期作品。技术为辅,娱乐为主,欢迎阅读,不吝赐教。

引言

image.png

那年我八岁,当我第一次看到狗屁不通文章生成器,我被它深不可测的语言功底深深震撼。

狗屁不通文章生成器,到底是一种怎么样的存在?了解清楚狗屁不通文章生成器到底是一种怎么样的存在,是解决一切问题的关键。可是,即使是这样,狗屁不通文章生成器的出现仍然代表了一定的意义。在这种困难的抉择下,本人思来想去,寝食难安。莎士比亚曾经说过,意志命运往往背道而驰,决心到最后会全部推倒。带着这句话,我们还要更加慎重的审视这个问题。

正因为如此,我决定从百忙之中抽出空来,瞻仰一下这件巧夺天工的伟大作品。

工作介绍

8c4b110588a2272ee18187939b258bad.png

作者的想法非常粗暴。

写一个 6000 字的文章,全文仅由四个部分组成:名人名言、前面的垫话、后面的垫话、废话

所谓垫话,就是名言前后用于衔接的句子,作者分成了两类:beforeafter

before位于名人和名言中间,用于描述名人以何种姿势说出了名言,如:

"曾经说过",
"在不经意间这样说过",
"说过一句著名的话",
"曾经提到过",
"说过一句富有哲理的话",
...

after位于句子之后,主要用来抒发作者的真情实感:

"这不禁令我深思. ",
"带着这句话, 我们还要更加慎重的审视这个问题: ",
"这启发了我. ",
"我希望诸位也能好好地体会这句话. ",
"这句话语虽然很短, 但令我浮想联翩. ",
"这句话看似简单,但其中的阴郁不禁让人深思. ",
"这句话把我们带到了一个新的维度去思考这个问题: ",
"这似乎解答了我的疑惑. "
...

看到这里,我已是一拍大腿,直呼 666!然而,接下来的废话才是精髓。在生成文章的过程中,废话不但要凑字数,还要承担保证行文逻辑连贯、思想丰富的重要任务。除此之外,用户输入的关键词也要在文章中体现名人名言前后的衔接句显然不适合,所以也只能在废话中插入。因此,每一句废话都需要精心设计:

"我们不得不面对一个非常尴尬的事实, 那就是, ",
"而这些并不是完全重要, 更加重要的问题是, ",
"带着这些问题, 我们来审视一下x. ",
"我们一般认为, 抓住了问题的关键, 其他一切则会迎刃而解.",
"x似乎是一种巧合,但如果我们从一个更大的角度看待问题,这似乎是一种不可避免的事实. ",
"既然如此, ",
"那么, ",
"经过上述讨论, ",
...

其中,x是作者预定义的关键词槽,用于替换成用户输入的关键词。

接下来,就是前面垫话 + 名言 + 后面垫话 + n句废话(n随机)循环,一直写到 6000 字,非常 AMAZING。

启发与改编

这使我不禁陷入深思。

这位作者用一个程序拯救了一位苦于 6000 字学生会退会申请的大一学弟,而在这背后,又有多少步履维艰的学弟学妹在各种形式主义的魔爪中苦苦挣扎!

范仲淹曾在邓州写下 “先天下之忧而忧,后天下之乐而乐”,千年之后,《岳阳楼记》中的这句话言犹在耳。于是,我决定先从学术论文下手,思考如何用你的在研课题或者选修课主题,尽我所能送你一篇高水平论文。

在简单整理了论文写作套路之后,深得 Bullshit Generator 真传的我,很快就整理出一个规模庞大、便于调用的语料库。接着,第一篇伟大作品诞生了。

28898ee98f491d80c0fd4994f8a9614d.jpg

如果你问我为什么是英文,那必然是有道理的。

  1. 英文论文往往有整理好的高质量句式,这保障了生成论文的专业性和丰富性,轻松保证你大学四年的选修课论文没有一句重复的话。
  2. 英文写出来的看起来更有逼格,别人一看肯定会觉得你的论文跟《银行家》的《父子集》有天壤之别,水平根本不在一个层次。
  3. 一般人抄完论文之后要先翻译成英文再翻译回来,降低查重率。我直接给你英文,帮你省了一半工序。
  4. 最重要的是,唯有英文,才能让读者产生抗拒心理,由于语言水平不够,一切狗屁不通统统成了顺理成章

e50b0d97d0cfa10425f9f0f3040ba14f.jpg

把上面的作品翻译一下,大概是这样:

495206224e4c1ce9abffbfab24bc6a7e.jpg

虽然由于机翻性能的局限性,原汁原味的作品被篡改得面目全非,但我想你应该依然可以从行文的字里行间,看出它标准的写作规范和扎实的专业素养。

换个例子,再试一次:

2c34f85f1778bcb7a399537f369f937b.jpg

读完这两篇小试牛刀的作品,有没有感觉醍醐灌顶呢?

如此神奇的论文生成器,我决定将它命名为:Scientific Bullshit Index (paper) Generator,简称SBI Generator。

它拥有丰富的语料库和灵活的算法,学生只要输入主题,就可以在1秒之内得到一篇逻辑流畅、措辞精炼的高水平全英论文。如果说Bullshit Generator是没有逻辑的无脑堆砌,那么SBI Generator则是始终以权威论文写作流程作为指导,坚持采用专业学术论文语料库的匠心雕琢。 前者是简单的、暴力的、两部分彼此拼凑、不断循环堆砌出来的。而后者,从逻辑上讲,是结构清晰的、一线串珠式的,一篇文章写到底的;从细节上讲,是语句精炼的、措辞专业的、标点规范的。非常 AMAZING!

回顾与思考

当然,我们知道,任何一个伟大的产品,它也不是一蹴而就的。

如你所观察,虽然仅仅是这两篇文章,就有一句话被重复使用。因为时间原因,有些地方我仅仅搜集了两三句话,所以难免会有重复。而且,客观地讲,这些内容甚至连通顺都谈不上。当然,这些问题是可以通过更用心的筛选、修饰来实现。然而,学术论文再怎么水,毕竟也不是一个词的信息量就能概括的,我的 SBIG 再怎么机智,也不会说给一个词就能编出一篇合格的论文,从信息论的角度来说也是这样。所以,指望靠大量句子的傻瓜堆砌,就能混过选修课的结课考核,这本身就是非常离谱的。

但是,有些东西可以。

虽然我高中没写过两千字甚至五千字的检讨,但是我能想象,这样一个鸿篇巨制,无非就是:我不该×m + 我错了×n + 原谅我×p + 我一定×q,然后整体再来几个循环,中间加些承上启下的点睛之笔。

与此类似的还有很多,比如 x x 申请书。除此之外,你也可以顺手写一个马屁生成器,输入xxx真xx,让程序自动帮你把平淡无奇的语言修饰得天花乱坠。

image.png

所以,依我拙见,在狗屁不通领域,只要稍加雕琢,就能有一番成就,正所谓 “三百六十行,行行出状元” 。如果你肯耐心整理材料,完成从0到1的这个枯燥过程,那么就有无数人可以享受从1到∞的美好成果。 这多是一件美事啊!

项目代码:Yuezih-Playground/Scientific Bullshit Generator (github.com)
(早期工作,年久失修。没有demo,摆烂开源。)


往期文章:

踢馆朋友圈迷宫挑战——自动寻路(Python实现) - 掘金 (juejin.cn)

被智商检测器侮辱之后,我直接怒开PyCharm - 掘金 (juejin.cn)

简陋无比的 Python 抠图方案,好像还挺像回事儿? - 掘金 (juejin.cn)