- 上一篇 站在信息巨人的肩膀上往哪看-序 - 掘金
- 下一篇 正篇(一)- 掘金
网络的过往
作为一个有考究的人,开始学习任何事物的开始,都得考虑一下它的历史,它的背景,它的来源,哲学的三问题“我从哪里来”,“我是谁”,“我要到哪里去”这是个万金油一样的粘合剂,只要有思考的地方,这个三个问题就和狗皮膏药一样,这是人类的智慧精华,但是和狗皮膏药没什么区别。
据网传,互联网前身是阿帕网(ARPANET),美国国防部高级研究计划局组建的计算机网络,最开始是连接几所大学的军用网络,UCLA,Stanford,UCSB,Utah等等,用于研究资料的共享,毕竟信息时代里,电子要比邮差跑得快,研究室和军方最希望的就是研究资料等信息的交流和情报的迅速传递,付出的成本就是在几座山里建立几个基站,拉几根网线,就能形成贯穿美国西部的信息网。 但是那时候不是有电话嘛,用电话解决情报的传递问题,何必加大成本建成用计算机内用独特协议传递信息的方式,那么计算机内的资料,暂时叫它“信息”,和电话机内的东西,管它叫“情报”;
信息和情报有什么不一样的地方,其实再问计算机和人有什么不一样的地方,再严格一些是问20世纪60年代末至20世纪70年代初的计算机和人有什么区别,最大的区别是脑的记忆容量,知识的存储方式(也可以说记忆方式),存储后的知识的提取方式这些都不一样,计算机可以将知识整理成一个图书馆,当然人也可以,但是计算机整理出的图书馆比人的要大很多,虽然人在如何处理知识方面的性能远远优于计算机。
回到那个为什么选择搭建网络而不是进一步加强电话设备的问题,如果是你,在那个时代会做出怎么样的选择,答案就是之后的历史,信息网络不出意料的发展到了现在的规模。
网络的现在
网络技术不停地更新,规模的增大,传递速度的加快,介于这个时代的材料和媒介,差不多应该达到一个瓶颈,如果说50年前是刚出生的婴儿,现在就可以说长成成年人,要说缺陷,“没有脑子”,巨大的信息量只是最简单的存储和查阅,信息流无法计算出最佳的通路,简单的说就是一片混沌,其实我想信息需要先完成一个定位的过程,形成一种标记,标记语言有多少人用过,用过的都应该清楚在整理信息方面,这种模式会带来多大的便捷,特别出信息的输入源很大的这个时代。如果说前50年是信息的成长,后面至少这个时代来说是信息的整理,但是人不能被庞大的信息吞噬,至少学会过滤必要的信息。
信息抓取的开始
其实上面的都是废话,我只是想记录下学习网页抓取的过程,网页抓取,网络爬虫,这次基于参考的教材是《Python 网络爬虫权威指南》,环境自己笔记本是装的win10, 用的IDE是Pycharm,具体开始记录下次开始吧,前面说了好多废话。
- 上一篇 站在信息巨人的肩膀上往哪看-序 - 掘金
- 下一篇 正篇(一)- 掘金