收集的PHP程序员的技术成长规划 按照了解的很多PHP/LNMP程序员的发展轨迹,结合个人经验体会,抽象出很多程序员对未来的迷漫,特别对技术学习的盲目和慌乱,简单梳理了这个每个阶段PHP程序员的技术要求,来帮助很多PHP程序做对照设定学习成长目标。 本文按照目前主流技术做了一个基本的梳理,整个是假设PHP程序员不是基础非常扎实的情况进行的设定,并且所有设定都非常具体明确清晰,可能会让人觉得不适,请理解仅代表一家之言。(未来技术变化不在讨论范围) 第一阶段:基础阶段(基础PHP程序员) 重点:把LNMP搞熟练(核心是安装配置基本操作) 目标:能够完成基本的LNMP系统安装,简单配置维护;能够做基本的简单系统的PHP开发;能够在PHP中型系统中支持某个PHP功能模块的开发。 时间:完成本阶段的时间因人而异,有的成长快半年一年就过了,成长慢的两三年也有。 1.Linux: 基本命令、操作、启动、基本服务配置(包括rpm安装文件,各种服务配置等);会写简单的shell脚本和awk/sed 脚本命令等。 2.Nginx: 做到能够安装配置nginx+php,知道基本的nginx核心配置选项,知道 server/fastcgi_pass/access_log 等基础配置,目标是能够让nginx+php_fpm顺利工作。 3.MySQL: 会自己搭建mysql,知道基本的mysql配置选项;知道innodb和myisam的区别,知道针对InnoDB和MyISAM两个引擎的不同配置选项;知道基本的两个引擎的差异和选择上面的区别;能够纯手工编译搭建一个MySQL数据库并且配置好编码等正常稳定运行;核心主旨是能够搭建一个可运行的MySQL数据库。 4.PHP: 基本语法数组、字符串、数据库、XML、Socket、GD/ImageMgk图片处理等等;熟悉各种跟MySQL操作链接的api(mysql/mysqli/PDO),知道各种编码问题的解决;知道常规熟练使用的PHP框架(ThinkPHP、Zendframework、Yii、Yaf等);了解基本MVC的运行机制和为什么这么做,稍微知道不同的PHP框架之间的区别;能够快速学习一个MVC框架。能够知道开发工程中的文件目录组织,有基本的良好的代码结构和风格,能够完成小系统的开发和中型系统中某个模块的开发工作。 5.前端: 如果条件时间允许,可以适当学习下 HTML/CSS/JS 等相关知识,知道什么web标准,div+css的web/wap页面模式,知道HTML5和HTML4的区别;了解一些基本的前端只是和JS框架(jQuery之类的);了解一些基本的JavaScript编程知识;(本项不是必须项,如果有时间,稍微了解一下是可以的,不过不建议作为重点,除非个人有强烈兴趣) 6.系统设计: 能够完成小型系统的基本设计,包括简单的数据库设计,能够完成基本的:浏览器 -> Nginx+PHP -> 数据库 架构的设计开发工作;能够支撑每天几十万到数百万流量网站的开发维护工作; 第二阶段:提高阶段 (中级PHP程序员) 重点:提高针对LNMP的技能,能够更全面的对LNMP有熟练的应用。 目标:能够随时随地搭建好LNMP环境,快速完成常规配置;能够追查解决大部分遇到的开发和线上环境的问题;能够独立承担中型系统的构架和开发工作;能够在大型系统中承担某个中型模块的开发工作;
-
Linux: 在第一阶段的基础上面,能够流畅的使用Shell脚本来完成很多自动化的工作;awk/sed/perl 也操作的不错,能够完成很多文本处理和数据统计等工作;基本能够安装大部分非特殊的Linux程序(包括各种库、包、第三方依赖等等,比如MongoDB/Redis/Sphinx/Luncene/SVN之类的);了解基本的Linux服务,知道如何查看Linux的性能指标数据,知道基本的Linux下面的问题跟踪等。
-
Nginx: 在第一阶段的基础上面,了解复杂一些的Nginx配置;包括 多核配置、events、proxy_pass,sendfile/tcp_*配置,知道超时等相关配置和性能影响;知道nginx除了web server,还能够承担代理服务器、反向静态服务器等配置;知道基本的nginx配置调优;知道如何配置权限、编译一个nginx扩展到nginx;知道基本的nginx运行原理(master/worker机制,epoll),知道为什么nginx性能比apache性能好等知识;
-
MySQL/MongoDB: 在第一阶段的基础上面,在MySQL开发方面,掌握很多小技巧,包括常规SQL优化(group by/order by/rand优化等);除了能够搭建MySQL,还能够冷热备份MySQL数据,还知道影响innodb/myisam性能的配置选项(比如key_buffer/query_cache/sort_buffer/innodb_buffer_pool_size/innodb_flush_log_at_trx_commit等),也知道这些选项配置成为多少值合适;另外也了解一些特殊的配置选项,比如 知道如何搭建mysql主从同步的环境,知道各个binlog_format的区别;知道MySQL的性能追查,包括slow_log/explain等,还能够知道基本的索引建立处理等知识;原理方面了解基本的MySQL的架构(Server+存储引擎),知道基本的InnoDB/MyISAM索引存储结构和不同(聚簇索引,B树);知道基本的InnoDB事务处理机制;了解大部分MySQL异常情况的处理方案(或者知道哪儿找到处理方案)。条件允许的情况,建议了解一下NoSQL的代表MongoDB数据库,顺便对比跟MySQL的差别,同事能够在合适的应用场景安全谨慎的使用MongoDB,知道基本的PHP与MongoDB的结合开发。
-
Redis/Memcached: 在大部分中型系统里面一定会涉及到缓存处理,所以一定要了解基本的缓存;知道Memcached和Redis的异同和应用场景,能够独立安装 Redis/Memcached,了解Memcahed的一些基本特性和限制,比如最大的value值,知道PHP跟他们的使用结合;Redis了解基本工作原理和使用,了解常规的数据类型,知道什么场景应用什么类型,了解Redis的事务等等。原理部分,能够大概了解Memcached的内存结构(slab机制),redis就了解常用数据类型底层实现存储结构(SDS/链表/SkipList/HashTable)等等,顺便了解一下Redis的事务、RDB、AOF等机制更好
-
PHP: 除了第一阶段的能力,安装配置方面能够随意安装PHP和各种第三方扩展的编译安装配置;了解php-fpm的大部分配置选项和含义(如max_requests/max_children/request_terminate_timeout之类的影响性能的配置),知道mod_php/fastcgi的区别;在PHP方面已经能够熟练各种基础技术,还包括各种深入些的PHP,包括对PHP面向对象的深入理解/SPL/语法层面的特殊特性比如反射之类的;在框架方面已经阅读过最少一个以上常规PHP MVC框架的代码了,知道基本PHP框架内部实现机制和设计思想;在PHP开发中已经能够熟练使用常规的设计模式来应用开发(抽象工厂/单例/观察者/命令链/策略/适配器 等模式);建议开发自己的PHP MVC框架来充分让开发自由化,让自己深入理解MVC模式,也让自己能够在业务项目开发里快速升级;熟悉PHP的各种代码优化方法,熟悉大部分PHP安全方面问题的解决处理;熟悉基本的PHP执行的机制原理(Zend引擎/扩展基本工作机制);
-
C/C++: 开始涉猎一定的C/C++语言,能够写基本的C/C++代码,对基本的C/C++语法熟悉(指针、数组操作、字符串、常规标准API)和数据结构(链表、树、哈希、队列)有一定的熟悉下;对Linux下面的C语言开发有基本的了解概念,会简单的makefile文件编写,能够使用简单的GCC/GDB的程序编译简单调试工作;对基本的网络编程有大概了解。(本项是为了向更高层次打下基础)
-
前端: 在第一阶段的基础上面,熟悉基本的HTTP协议(协议代码200/300/400/500,基本的HTTP交互头);条件允许,可以在深入写出稍微优雅的HTML+CSS+JavaScript,或者能够大致简单使用某些前端框架(jQuery/YUI/ExtJS/RequireJS/BootStrap之类);如果条件允许,可以深入学习JavaScript编程,比如闭包机制、DOM处理;再深入些可以读读jQuery源码做深入学习。(本项不做重点学习,除非对前端有兴趣)
-
系统设计: 能够设计大部分中型系统的网站架构、数据库、基本PHP框架选型;性能测试排查处理等;能够完成类似:浏览器 -> CDN(Squid) -> Nginx+PHP -> 缓存 -> 数据库 结构网站的基本设计开发维护;能够支撑每天数百万到千万流量基本网站的开发维护工作;
第三阶段:高级阶段 (高级PHP程序员)
重点:除了基本的LNMP程序,还能够在某个方向或领域有深入学习。(纵深维度发展) 目标:除了能够完成基本的PHP业务开发,还能够解决大部分深入复杂的技术问题,并且可以独立设计完成中大型的系统设计和开发工作;自己能够独立hold深入某个技术方向,在这块比较专业。(比如在MySQL、Nginx、PHP、Redis等等任一方向深入研究)
- Linux: 除了第二阶段的能力,在Linux下面除了常规的操作和性能监控跟踪,还能够使用很多高级复杂的命令完成工作(watch/tcpdump/starce/ldd/ar等);在shell脚本方面,已经能够编写比较复杂的shell脚本(超过500行)来协助完成很多包括备份、自动化处理、监控等工作的shell;对awk/sed/perl 等应用已经如火纯青,能够随意操作控制处理文本统计分析各种复杂格式的数据;对Linux内部机制有一些了解,对内核模块加载,启动错误处理等等有个基本的处理;同时对一些其他相关的东西也了解,比如NFS、磁盘管理等等;
- Nginx: 在第二阶段的基础上面,已经能够把Nginx操作的很熟练,能够对Nginx进行更深入的运维工作,比如监控、性能优化,复杂问题处理等等;看个人兴趣,更多方面可以考虑侧重在关于Nginx工作原理部分的深入学习,主要表现在阅读源码开始,比如具体的master/worker工作机制,Nginx内部的事件处理,内存管理等等;同时可以学习Nginx扩展的开发,可以定制一些自己私有的扩展;同时可以对Nginx+Lua有一定程度的了解,看看是否可以结合应用出更好模式;这个阶段的要求是对Nginx原理的深入理解,可以考虑成为Nginx方向的深入专业者。
- MySQL/MongoDB: 在第二阶段的基础上面,在MySQL应用方面,除了之前的基本SQL优化,还能够在完成一些复杂操作,比如大批量数据的导入导出,线上大批量数据的更改表结构或者增删索引字段等等高危操作;除了安装配置,已经能够处理更多复杂的MySQL的问题,比如各种问题的追查,主从同步延迟问题的解决、跨机房同步数据方案、MySQL高可用架构等都有涉及了解;对MySQL应用层面,对MySQL的核心关键技术比较熟悉,比如事务机制(隔离级别、锁等)、对触发器、分区等技术有一定了解和应用;对MySQL性能方面,有包括磁盘优化(SAS迁移到SSD)、服务器优化(内存、服务器本身配置)、除了二阶段的其他核心性能优化选项(innodb_log_buffer_size/back_log/table_open_cache/thread_cache_size/innodb_lock_wait_timeout等)、连接池软件选择应用,对show *(show status/show profile)类的操作语句有深入了解,能够完成大部分的性能问题追查;MySQL备份技术的深入熟悉,包括灾备还原、对Binlog的深入理解,冷热备份,多IDC备份等;在MySQL原理方面,有更多了解,比如对MySQL的工作机制开始阅读部分源码,比如对主从同步(复制)技术的源码学习,或者对某个存储引擎(MyISAM/Innodb/TokuDB)等等的源码学习理解,如果条件允许,可以参考CSV引擎开发自己简单的存储引擎来保存一些数据,增强对MySQL的理解;在这个过程,如果自己有兴趣,也可以考虑往DBA方向发展。MongoDB层面,可以考虑比如说在写少读多的情况开始在线上应用MongoDB,或者是做一些线上的数据分析处理的操作,具体场景可以按照工作来,不过核心是要更好的深入理解RMDBS和NoSQL的不同场景下面的应用,如果条件或者兴趣允许,可以开始深入学习一下MongoDB的工作机制。
- Redis/Memcached: 在第二阶段的基础上面,能够更深入的应用和学习。因为Memcached不是特别复杂,建议可以把源码进行阅读,特别是内存管理部分,方便深入理解;Redis部分,可以多做一些复杂的数据结构的应用(zset来做排行榜排序操作/事务处理用来保证原子性在秒杀类场景应用之类的使用操作);多涉及aof等同步机制的学习应用,设计一个高可用的Redis应用架构和集群;建议可以深入的学习一下Redis的源码,把在第二阶段积累的知识都可以应用上,特别可以阅读一下包括核心事件管理、内存管理、内部核心数据结构等充分学习了解一下。如果兴趣允许,可以成为一个Redis方面非常专业的使用者。
- PHP: 作为基础核心技能,我们在第二阶段的基础上面,需要有更深入的学习和应用。从基本代码应用上面来说,能够解决在PHP开发中遇到95%的问题,了解大部分PHP的技巧;对大部分的PHP框架能够迅速在一天内上手使用,并且了解各个主流PHP框架的优缺点,能够迅速方便项目开发中做技术选型;在配置方面,除了常规第二阶段会的知识,会了解一些比较偏门的配置选项(php auto_prepend_file/auto_append_file),包括扩展中的一些复杂高级配置和原理(比如memcached扩展配置中的memcache.hash_strategy、apc扩展配置中的apc.mmap_file_mask/apc.slam_defense/apc.file_update_protection之类的);对php的工作机制比较了解,包括php-fpm工作机制(比如php-fpm在不同配置机器下面开启进程数量计算以及原理),对zend引擎有基本熟悉(vm/gc/stream处理),阅读过基本的PHP内核源码(或者阅读过相关文章),对PHP内部机制的大部分核心数据结构(基础类型/Array/Object)实现有了解,对于核心基础结构(zval/hashtable/gc)有深入学习了解;能够进行基本的PHP扩展开发,了解一些扩展开发的中高级知识(minit/rinit等),熟悉php跟apache/nginx不同的通信交互方式细节(mod_php/fastcgi);除了开发PHP扩展,可以考虑学习开发Zend扩展,从更底层去了解PHP。
- C/C++: 在第二阶段基础上面,能够在C/C++语言方面有更深入的学习了解,能够完成中小型C/C++系统的开发工作;除了基本第二阶段的基础C/C++语法和数据结构,也能够学习一些特殊数据结构(b-tree/rb-tree/skiplist/lsm-tree/trie-tree等)方便在特殊工作中需求;在系统编程方面,熟悉多进程、多线程编程;多进程情况下面了解大部分多进程之间的通信方式,能够灵活选择通信方式(共享内存/信号量/管道等);多线程编程能够良好的解决锁冲突问题,并且能够进行多线程程序的开发调试工作;同时对网络编程比较熟悉,了解多进程模型/多线程模型/异步网络IO模型的差别和选型,熟悉不同异步网络IO模型的原理和差异(select/poll/epoll/iocp等),并且熟悉常见的异步框架(ACE/ICE/libev/libevent/libuv/Boost.ASIO等)和使用,如果闲暇也可以看看一些国产自己开发的库(比如muduo);同时能够设计好的高并发程序架构(leader-follow/master-worker等);了解大部分C/C++后端Server开发中的问题(内存管理、日志打印、高并发、前后端通信协议、服务监控),知道各个后端服务RPC通信问题(struct/http/thirft/protobuf等);能够更熟络的使用GCC和GDB来开发编译调试程序,在线上程序core掉后能够迅速追查跟踪解决问题;通用模块开发方面,可以积累或者开发一些通用的工具或库(比如异步网络框架、日志库、内存池、线程池等),不过开发后是否应用要谨慎,省的埋坑去追bug;
- 前端: 深入了解HTTP协议(包括各个细致协议特殊协议代码和背后原因,比如302静态文件缓存了,502是nginx后面php挂了之类的);除了之前的前端方面的各种框架应用整合能力,前端方面的学习如果有兴趣可以更深入,表现形式是,可以自己开发一些类似jQuery的前端框架,或者开发一个富文本编辑器之类的比较琐碎考验JavaScript功力;
- 其他领域语言学习: 在基础的PHP/C/C++语言方面有基本积累,建议在当前阶段可以尝试学习不同的编程语言,看个人兴趣爱好,脚本类语言可以学学 Python/Ruby 之类的,函数式编程语言可以试试 Lisp/Haskell/Scala/Erlang 之类的,静态语言可以试试 Java/Golang,数据统计分析可以了解了解R语言,如果想换个视角做后端业务,可以试试 Node.js还有前面提到的跟Nginx结合的Nginx_Lua等。学习不同的语言主要是提升自己的视野和解决问题手段的差异,比如会了解除了进程/线程,还有轻量级协程;比如在跨机器通信场景下面,Erlang的解决方案简单的惊人;比如在不想选择C/C++的情况下,还有类似高效的Erlang/Golang可用等等;主要是提升视野。
- 其他专业方向学习: 在本阶段里面,会除了基本的LNMP技能之外,会考虑一些其他领域知识的学习,这些都是可以的,看个人兴趣和长期的目标方向。目前情况能够选择的领域比较多,比如、云计算(分布式存储、分布式计算、虚拟机等),机器学习(数据挖掘、模式识别等,应用到统计、个性化推荐),自然语言处理(中文分词等),搜索引擎技术、图形图像、语音识别等等。除了这些高大上的,也有很多偏工程方面可以学习的地方,比如高性能系统、移动开发(Android/IOS)、计算机安全、嵌入式系统、硬件等方向。
- 系统设计: 系统设计在第二阶段的基础之上,能够应用掌握的经验技能,设计出比较复杂的中大型系统,能够解决大部分线上的各种复杂系统的问题,完成类似 浏览器 -> CDN -> 负载均衡 ->接入层 -> Nginx+PHP -> 业务缓存 -> 数据库 -> 各路复杂后端RPC交互(存储后端、逻辑后端、反作弊后端、外部服务) -> 更多后端 酱紫的复杂业务;能够支撑每天数千万到数亿流量网站的正常开发维护工作。
第四阶段:架构阶段 (架构师) ps: 暂时不展开讨论,等下次专门撰文来描述补充本部分内容 第五阶段:专家阶段(方向领域专家) ps:高大上,这块不展开讨论 ^^ 第六阶段:科学家阶段 ps:高大上,这块不展开讨论 ^^
=======================================================================================================著作权归作者所有。 商业转载请联系作者获得授权,非商业转载请注明出处。 作者:宝术 链接:www.zhihu.com/question/35… 来源:知乎 如何提高代码质量?【开发能力】 如何提高架构水平?【架构能力】 如何控制产品需求的合理性和迭代节奏?【项目管理-需求分析/项目规划】 如何降低加班强度?【项目管理-资源管理】 如何积累知识库,降低口传心授的依赖?【团队建设-知识库建设】 如何提倡团队合作文化?【团队建设-价值观建设/绩效设计】 如何培养团队技术梯队,不强依赖几个核心员工?【团队建设-梯队培养】 如何避免自有通过QA才能保障产品质量的困境?【开发能力-质量保障】 如何提升系统稳定性和可用性?【架构能力】 如何通过产品大图整理出清晰的业务模型?【架构能力-产品规划】 如何拒绝业务方的不合理需求?【项目管理-需求管理】 如何降低人员流失率【团队建设-可惜离职率】 如何在飞速发展的业务环境下回答以上问题?【可落地方案】 自顶向下,依次需要解决的点是: 价值观建设 提倡团队合作。提倡合作?然并卵,谁鸟你,一句现在很忙就把你憋死。作为leader,还是要搞好人际关系,靠刷脸去推合作。 提倡敬业和激情。自己先要成为榜样,不过重要的还是看激励政策。 绩效设计原则 重视拿结果,更重视执行过程。发现、表扬、提拔代码写得好,业务也玩的溜的人。管理不能停留在表面上,要到代码里去。 重视个人技术能力,更重视技术传承、培养人。诶,说你呢,没带过人的同学别想加工资,想晋升给我先带3个徒弟出来。 重视技术创新。天天重复自己的人,再老资格也要给他敲警钟,该fire就fire。挤出项目的时间余量给有想法的人做点不一样的事;必须要有一支发明家队伍,而不是码农队伍,所以,搞条鲶鱼进去动动风水,会有好处的。 产品研发流程 流程保护。和产品团队、业务团队磨合出固定的迭代流程和节奏,并能坚持下来,坚决抵抗不合理的需求和节奏,有理有据地向上反馈。 产品话语权。一个产品设一个技术owner,要具有对该产品的需求评审,设计评审权,开发人员要参与业务调研/业务分析,影响产品设计,争取产品规划和业务模型的话语权。避免成为单纯的技术资源,疲于奔命。 跨部门沟通。提前和产品部门沟通双方的预期和能力,将产品规划和技术规划结合起来考虑,3个月协调一次。 团队建设 人才梯队建设。高手不能太多,也不能太少。微妙,自己意会,橄榄形社会最有活力。 hire and fire。60%流失率,这窟窿!还是先加工资要紧,狠狠加,先把队伍拉起来,才有余力做重构的活。 团队文化建设。不管是美国还是中国,哪个总统/主席,都得有个施政口号,让人知道你要干什么,分清敌我。 团队技术能力发展。先把人找齐了。。。 项目管理 敏捷也好,瀑布也要,反正要找个合适自己的项目流程,并严格灵活地执行下去。 加强项目复盘环节,code review。 维持一个合适的工作松紧度。 项目管理的精髓是什么》》》我个人认为是制度化,制度化的坏处其实非常多,但有一条好处,就值得我们采用:那就是有强大的理由能按我安排的时间、我安排的地点来打仗。优秀的pm无一不是时间管理的高手,敢于向试图越过制度胡乱插手的领导说不,这就是项目团队的福音。 系统架构 与实际需求相关,无非就是提升稳定性,可用性、可维护性、安全性的那些架构招数,譬如SOA、服务治理、中间件、负载均衡、降级等等。一个简单清晰可靠、可快速横向扩展的系统架构是基石。 业务架构 业务模型重构 模块化,插件化设计 平台化架构 产品质量 编程规范 设计模式 单元测试和自测 QA 和 code review 故障复盘 组织发展 知识传承 挖掘技术深度和创新意识 内部培训和外部培训 鼓励创新的机制 写完回顾一下,自己都觉得好笑,有点空列大纲无法落地的感觉,呵呵,实际的困难肯定远远超出预期。要想改变一条船的航向,首先你得有舵手的影响力(成功资历,直接管理技术团队),其次获取船长(老板)的支持,再次你得真的知道正确的航向(怎么做),接着得到船员的支持(公司其他团队的理解),优化调动自己的力量(所有开发都认同你的理念,招聘合适的人才),然后还要避开暗礁(别让项目失败),通过一次次的胜利来巩固你的正义。
太他妈的难了,所以很多人都劝你开溜,他们是对的,因为99%的老板都看不懂以上这些文字和它们的价值,但老板还知道加人加工资,说明有希望。~~
问问自己,有这个实力吗,确信,扑上去。
====================================================================== 著作权归作者所有。 商业转载请联系作者获得授权,非商业转载请注明出处。 作者:chason 链接:www.zhihu.com/question/20… 来源:知乎
多工作几年的php开发者都会有这样的迷茫,php开发多了,无外乎“增删改查调接口”,真的是这样吗?
实际上开发者除了把自己当成php程序员,更应该关注php以外的东西,将自己定位于能熟练使用php搭建系统的工程师。
我认为高级php工程师可以往几个方向去发展: 1.深度方向 一个工程师要往高阶发展,必须同时强化几个技术能力: 设计能力:懂得如何利用分层、面向对象、设计模式等设计组织代码 编码能力:熟悉php语法特性,知道怎么用一两行代码代替初级开发者十几上百行代码。 工程能力:学会如何快速构建工程,学会如何构建可读、可扩展性的工程,学会如何避免埋坑给后人,学会如何与人协作维护工程,学会如何保证工程质量,学会如何权衡利弊,学会如何在困难面前妥协。 抽象能力:初级开发者通常会等到逻辑重复时再抽象封装(甚至怕拖进度或者懒惰而放弃),而高级开发者通常一开始写出的逻辑就为了以后的重用,并且深知一开始多付出的思考设计时间最终都会因为复用得到回报。很多开发框架就是一步步抽象/埋坑/优化而来的。 架构能力:一个业务系统如何划分模块,模块之间如何协作通信,每个模块的技术选型如何做,系统细节如何规避问题等等。 优化能力:学会如何评估、分析、提升系统性能。优化途径很多,产品功能优化、业务逻辑优化、基础技术优化、操作系统底层硬件的优化等等。
2.广度方向 php开发基本上离不开操作系统、存储、缓存、网络、webserver等等配套设施,因此这也是高阶必备技能。一旦业务系统出问题了,必须要能快速定位解决(不一定自己解决,但要知道找到哪个负责人来解决)。
比如存储mysql,高级开发者会懂得利用索引、利用分表分库提高查询性能,懂得负载均衡和灾备提高性能提高可靠性(虽然是DBA的工作,但了解了有助于出问题时排查)
比如缓存,高级开发者懂得如何有效且最大限度利用缓存系统提高应用性能。
比如http,初级开发者往往只懂得http网络请求就只一去一回两个包,高级开发者会去深究网络七层模型、会深究http请求的各个环节(DNS、三次握手等等)
比如web前端,学习如何依靠浏览器缓存、CDN缓存、压缩代码、合并文件等等提高前端性能,学习如何进行前端安全攻防。
3,软素质 懂得团队管理,项目管理,沟通技巧等等。(有空再展开)
以上观点同样适用于其他语言的开发者。
著作权归作者所有。 商业转载请联系作者获得授权,非商业转载请注明出处。 作者:者年 链接:www.zhihu.com/question/28… 来源:知乎
做web的,在语言层面有很大的区别么?在框架层面有很大区别么?
关键点:
- http 协议
- 各级缓存(浏览器缓存,web 缓存,db缓存)
- 并发,集群状态如何同步?
- 静态服务,动态服务,数据服务如何组建可扩展集群?
框架:都是那么几个领域呀。
- MVC
- ORM
- Cache
至于其它是基于业务功能需求延伸:
- 消息队列
- 安全处理
- RESTful 接口
- 数据接口
- 全文搜索 ... ... 都是特定场景下的 web 应用需求。
上面这些好像都是同开发语言无关的知识技能,你若全掌握,使用php, java, ruby, python 甚至c++,都是同样的思路处理,没什么区别。
剩下的,就是经验方面的了:
- 如何处理更安全
- 如何划分功能模块更容易扩展
- 如何应付高并发
- 如何处理数据备份 ... ...
所以,总的来说,给我的感觉,你来不及,因为你还在纠结语言这个小小的东西,其它很多 web 开发的东西,你没注意到。 做 web 后端,使用一种语言,全处理过上面的问题后,你会一览众山小的。
另一个方面,具体到具体开发语言,语言的语法特性不同,因而框架在解决相同问题的领域,基于各自的特性所选择的不同的方案,这个可以对比下.
关键思路:不要以语言定路线,而是要以领域定路线。
著作权归作者所有。 商业转载请联系作者获得授权,非商业转载请注明出处。 作者:何广宇 链接:www.zhihu.com/question/19… 来源:知乎
我觉得,如果一个应聘者能对如下关于LMAPJ(J指Javascript)方面的问题有自己的实战经验或者能提出解决方案的,都是可以考虑录用的。以下只是个人最近的一些思考,不见得合理,但是我会很愿意和能清楚解答如下问题的人在一起工作的。 ======================================
== PHP ==
编码规范
你在以前的项目中采用什么样的编码规范?
正则
你对正则有多熟悉?在以前的项目中用过吗?用在哪些地方了?是自己写的,还是从网上找的?
以下是apache的一段访问日志,从中取出访问的站点名称,访问者ip (访问时间,访问页面,访问者的客户端)
www.fake.com:80 157.55.16.231 - - [25/Dec/2011:06:44:08 +0800] "GET /robots.txt HTTP/1.1" 200 394 "-" "Mozilla/5.0 (compatible; bingbot/2.0; +Meet our crawlers)" site1.fake.com:80 61.175.193.51 - - [25/Dec/2011:07:02:28 +0800] "GET /home/list HTTP/1.0" 302 399 "www.a.com/" "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; WOW64; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; MASN)" site2.fake.com:80 61.237.230.38 - - [25/Dec/2011:09:55:55 +0800] "GET /blog/archive/?year=2010 HTTP/1.1" 200 8467 "-" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.1; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; CIBA; Tablet PC 2.0; InfoPath.3; MS-RTC LM 8; 360SE)"
开发过PHP的CLI程序吗?
你做的哪个东西自己都觉得自己很NB?
有哪些好书可以推荐一下吗?
Book List
== Javascript ==
你是怎么接触并学习js的?
在团队中,采用什么机制来解决命名冲突的?
采用什么办法来保证代码质量的?
知道jslint吗?使用过吗?用多长时间了?怎么和日常的开发工作结合在一起的?
jQuery熟吗?写过jQuery的插件吗?
有哪些好书可以推荐一下吗?
Book List
js语言精粹 [JavaScript高级程序设计(第2版)].(美)泽卡斯 High Performance JavaScript - Nicholas C. Zakas
== Linux ==
linux熟吗?使用多长时间了?
常用工具: vim,grep,sed,awk,wget,curl...熟吗?
写过shell脚本吗?
管理过服务器吗?
有哪些好书可以推荐一下吗?
Book List
[sed与awk(第二版)].(美)多尔蒂,(美)罗宾斯
== Apache ==
会配置虚拟主机吗?有几种配置方法?(基于ip的,基于端口的,基于域名的,混杂的)
浏览器缓存是怎么使用的?(mod expires)
== MySQL ==
你接触到的最大的mysql数据库表是多大?(行记录数大概是什么量级的?)
使用的是哪种存储引擎(MyISAM, InnoDB, ...)
出现性能瓶颈时是如何解决的?
自己创建过索引吗?是怎么决定要在某些列上创建索引的?
关于索引,清楚MyISAM与InnoDB的区别吗? MyISAM的主键索引和其它索引有区别吗? InnoDB的主键索引和其它索引有区别吗?
有哪些好书可以推荐一下吗?
Book List
[MySQL技术内幕InnoDB存储引擎].姜承尧 [高性能MySQL(第2版)中文版].施瓦茨
== 其它 ==
数据结构和算法怎么样?觉得有用吗?在什么地方用到了?有什么好书推荐一下吗?
除了PHP,还有哪门语言是你的强项,可以拿来用在production中的?
工作之余做过什么有意思的项目吗?
有好的技术博客推荐一下吗?
风雪之隅-Laruence的博客 酷壳 – CoolShell.cn 黑客志 | Hacker的社交礼仪与自我修养
csdn的用户名密码泄露出来一批,有643W多(其格式是username # password # email),现在想把它导到数据库里,你有什么办法?
================================================================================================== 著作权归作者所有。 商业转载请联系作者获得授权,非商业转载请注明出处。 作者:吴止介 链接:www.zhihu.com/question/19… 来源:知乎
经验所谈,禁止转载! 上面的回答可能仅仅是针对初级程序员制定的,我讲讲各个层级的吧!
首先我觉得做一份笔试或机试是很重要的,不一定非得全部作对,能看到很多交谈中看不到的问题!
既然是PHP程序员得围绕PHP各方面问问 PHP 基础: 单引号和双引号区别? GET和POST的FORM表单的Action有什么区别? Session工作原理 如何取出数组最后一个值? Git分支合并 翻转字符串"example" 打印出2014-09-23 23:08:01的时间戳 Debug方法 Composer用法
进阶: 框架各部分了解程度(路由、设计规则、数据层包装、视图层、可扩展等) 面向对象的了解程度(静态方法、变量可用范围、抽象类、接口、继承、克隆、魔术方法等) 命名空间 测试用例 异常处理 缓存数据(memcache、redis、模板缓存、apc等各类缓存) 正则测试
高级: PHP SPL 设计模式(挑选两个,比如工厂、单例讲讲) 排序算法(挑选两个,比如冒泡排序、插入排序讲讲应用点) 加密算法(挑选两个,比如sha、crc32讲讲应用点以及区别) 测试驱动开发 敏捷开发思考 最优开发模式 疑难问题解决方法
安全 分别讲讲XSS、CSRF原理和防范 SQL注入防范 上传应该注意哪些问题 变量覆盖问题 危险函数该如何处理 服务基线 安全域
数据库 事务处理 各类锁处理 分库、主从与离线 左连接、右连接、交叉连接 SQL优化 不常用SQL函数应用 曾经遇到的坑
Linux 挑选两个命令,比如find、awk用法 文件排序方法(比如取某文件夹最后修改的文件并将大小显示为以M为单位的) python、shell等脚本程度
写的比较仓促,有漏掉的再补充!
上面主要侧重技术层面,其实很多技术对于一些人来说学起来很快的,所以还是人聪明或学习能力强最重要。
著作权归作者所有。 商业转载请联系作者获得授权,非商业转载请注明出处。 作者:曹政 链接:www.zhihu.com/question/20… 来源:知乎
我对各种框架均毫无兴趣,哎。 说一下我的理解 1:安全 SQL注入,跨站脚本,XSS蠕虫,典型的上传漏洞及其他风险,以及CC攻击的原理和防范,不懂安全的开发工程师一定是不合格的。 2:数据库 能正确理解数据索引的原理,至少应包括hash索引和btree类索引,知道索引优化的原理和查询效率的分析方法。 这个说上去简单,根据我们的面试情况,未经受我们培训的工程师,能满足这个条件的十不及一。当然,北上广大公司多,可能会好一些。 知道关系型数据库和key-value数据库,以及内存数据库的各自优缺点和适用场景,可以根据具体业务诉求选择合适的数据存储模式。 有人会说,这不是DBA的活么?我一直觉得开发工程师和DBA压根就不应该区分出来,也许我有点偏执吧,不过我们公司基本上都要求开发工程师来兼任这一工作了。 3: 调试和测试的能力 这个虚一点,只说几个场景。 遇到各类型错误输出的显性bug,知道通过搜索获得辅助资料,并解决之。 遇到结果与期望不一致的隐形bug,诸如数据逻辑错误或者一些判断分支错误的问题,知道设计断点和输出中间数据来逐步定位问题。 在完成较大的工作任务时,知道每个步骤环节需要独立的测试,而不是笼统弄到一起才想到需要测试。 在业务诉求需要满足较高访问规模或公开暴露于外网有可能导致CC攻击时,知道提前做压力测试并给出性能指标。 4:代码注释 说注释而非文档,因为很难要求其他程序员一边看文档一边看程序,所以代码内的注释其实是非常关键的,发布版本的代码基于某些考虑可以取消注释;但是要保留一份原始带有详尽注释的代码。 5:业务需求理解力 我一向认为,php不是纯技术工种,更多直接面向需求,所以,对业务需求理解力越强,与有关产品人员,业务人员的沟通越顺畅,工作效果会越好;相信我,每个产品人员都喜欢懂需求,易沟通的开发工程师。 6:如有可能,对运维有一点了解最好,因为有时候,出一些诡异bug的时候,你需要做出正确的判断可能需要对运维环境有一定的认识。
著作权归作者所有。 商业转载请联系作者获得授权,非商业转载请注明出处。 作者:曹政 链接:www.zhihu.com/question/21… 来源:知乎
1 介绍自己过去工作中,或学习中,最能体现自己价值的成就。 -> 等介绍完后,这个成就实现时,遇到过怎样的困难,如何解决的。 2 解释一下SQL注入的原理及危害,假设这里有一个不严谨的登陆程序,如何利用SQL注入进入。 3 解释一下跨站脚本的原理及危害,假设这里有一个不严谨的留言板,请构造跨站脚本范例。 4 解释一下数据索引为什么能提高效率。 场景SQL select * from user where area='广州‘ and sex='女‘ order by lastlogin desc limit 30; 如何设计索引? 现在有10万条 IP地址对应区间表,格式为 startip, endip, area 要求每个用户访问时都能快速分析出对方地区,请设计实现。数据库或不用数据库,要求每秒钟实现超过千次的查询。 基本上到这些对我而言就已经足够了,如果上面题目特别满意的,再附加 5 现在有一个屏蔽词列表,大约几千个词;假设有一个繁忙的论坛社区,发帖量巨大,要求用户每发一篇文章就要快速分析是否包含屏蔽词,请给出程序设计。 6 一个游戏网站,有数千个小游戏,每个游戏要做积分排行,数据结构如下 gameid,userid,gamescore 每天数百万积分提交,数据量巨大,目前要求分库处理。 要求,可以基于每个游戏id可以查询积分排行榜。 可以基于用户id查询,比如自己或好友的历史游戏积分记录。请问如何处理分库。
最后,你有什么要问的?
著作权归作者所有。 商业转载请联系作者获得授权,非商业转载请注明出处。 作者:匿名用户 链接:www.zhihu.com/question/21… 来源:知乎
0.简单做一下自我介绍,? 然后谈一下近三年来你的得意之作? 1.看看简历,会问一些过去做的项目的用户量、pv、吞吐量、相关难点和解决方法等 2.数据库设计经验,为什么进行分表? 分库? 一般多少数据量开始分表? 分库? 分库分表的目的? 什么是数据库垂直拆分? 水平拆分? 分区等等?可以举例说明 3.数据库优化有哪些? 分别需要注意什么? 4.web开发方面会遇到哪些缓存? 分别如何优化? 5.给你256M的内存,对10G的文件进行排序(文件每行1个数字),如何实现? 对10G的文件进行查找如何实现? 统计10G文件每个关键字出现的次数如何实现? 6.假如你现在是12306火车订票的设计师,你该如何设计满足全国人民订票? 7.假如有1亿用户的访问量,你的服务器架构是怎样的? 用户信息的存储方案如何设计? 8.如果你是技术组长,所带团队任务进度无法完成你该如何解决? 如果在进度排满的前提下插入任务,你该如何保证总进度不延期? 如果有的工程师今天预定任务没有完成,你该如何解决? 9.从你的经验方面谈一下如何构建高性能web站点? 需要哪些环节? 步骤? 每个步骤需要注意什么如何优化等?
- 为什么要对数据库进行主从分离?
- 如何处理多服务器共享session?
- 一个10G的表,你用php程序统计某个字段出现的次数,思路是?
- 会告诉你一个nginx日志例子,用你认为最佳的编程语言统计一下http响应时间超过1秒的前10个url?
- 给你一个mysql配置文件,用你认为最佳的编程语言解析该文件?
- 给你两个路径a和b,写一个算法或思路计算a和b差距几层并显示a和b的交集?
- 给你一个url,在nginx配置一下rewrite指定到某个具体路径?
- 一个php文件的解释过程是? 一般加速php有哪些? 提高php整体性能会用到哪些技术?
- session和cookie生存周期区别? 存储位置区别?
- require、include、require_once、include_once区别? 加载区别? 如果程序按需加载某个php文件你如何实现?
- chrome号称为多线程的,所以多线程和多进程的区别为?
- php在2011年底出现hash碰撞,hash碰撞原理为? 如何进行修复?
- web不安全因素有哪些? 分别如何防范?
- 假如两个单链表相交,写一个最优算法计算交点位置,说思路也可以?
- 假如你是技术组长? 如何提高团队效率?
- nginx负载均衡有哪些? 如果其中一台服务器挂掉,报警机制如何实现?
- 不优化前提下,apache一般最大连接数为? nginx一般最大连接数为? mysql 每秒insert ? select ? update ? delete?
- mysql 数据类型有哪些 ? 分别占用多少存储空间 ?
- nginx设置缓存js、css、图片等信息,缓存的实现原理是?
- 如何提高缓存命中率? 如何对缓存进行颗粒化?
- php的内存回收机制是?
- 我的所有问题都问完了,你有什么问题问我没有? =========================================================================
著作权归作者所有。 商业转载请联系作者获得授权,非商业转载请注明出处。 作者:牛浩帆 链接:www.zhihu.com/question/20… 来源:知乎
[只是大框架介绍,实际使用中的不容易注意的细节太多了,需要经验的积累,才能运用娴熟]
以下的架构都是在假设已经优化过linux内核的情况下进行
初级篇:(单机模式)
假设配置:(Dual core 2.0GHz,4GB ram,SSD)
基础框架:apache(PHP) + Mysql / IIS + MSSQL (最基础框架,处理一般访问请求)
进阶1:替换Apache为Nginx,并在数据库前加上cache层【数据库的速度是最大的瓶颈】 Nginx(PHP) + Memcache + Mysql (此时已经具备处理小型访问量的能力)
进阶2:随着访问量的上涨,最先面临的问题就来了:CGI无法匹配上Nginx的高IO性能,这时候可以通过写扩展来替代脚本程序来提升性能,C扩展是个好办法,但是大家更喜欢用简单的脚本语言完成任务,Taobao团队开源了一个Nginx_lua模块,可以用lua写Nginx扩展,这时候可处理的并发已经超越进阶1 一个档次了。 Nginx(nginx_lua or C) + Memcache + Mysql (此时处理个同时在线三四千人没有问题了)
进阶3:随着用户的增多,Mysql的写入速度成了又一大瓶颈,读取有memcache做缓存,但写入是直接面对Mysql,性能受到了很大阻碍,这时候,要在Nginx和Mysql中间加入一层写缓存,队列系统就出场了,就以RabbitMQ为例,所有写入操作全部丢到这只兔子的胃里面,然后屁股后面写个接应程序,一条条的拉出来再写入mysql。而RabbitMQ的写入效率是Mysql的N倍,此时架构的处理能力又上一阶层。 |----write------>RabbitMQ-------- Nginx(lua or c)----- |--------->Mysql |----read------>Memcache--------
(此时的并发吞吐能力已经可以处理万人左右在线)
中级篇:(分而治之)
此时我们在单机优化上已经算是达到极限,接下来就要集群来显示作用了。
数据库篇: 数据库总是在整个环节中是吞吐能力最弱的,最常见的方法就是sharding。 sharding可以按多种方法来分,没有定式,看情况。可以按用户ID区段分,按读写分等等,可用参考软件:mysql proxy(工作原理类似lvs)
缓存篇:memcache一般采用的是构建memcache pool,将缓存分散到多台memcache节点上,如何将缓存数据均匀分散在各节点,一般采用将各节点顺序编号,然后hash取余对应到各个节点上去。这样可以做到比较均匀的分散,但是有一个致命点就是,如果节点数增加或减少,将会带来几乎80%的数据迁移,解决方案我们在高级篇再提。
WEB服务器篇: web服务器集群的建设,最常见的就是lvs方式(memcache pool同样可以如此组建),lvs的核心就是调度节点,调度节点负责将流量通过算法分散到各个节点上,因调度所耗资源很少,所以可以产生很高的吞吐率,后台节点数量可以任意增删,但此法弊病就是如果调度节点挂了,则整个集群都挂了,解决方案我们在高级篇提。 方法2:参见 HAProxy - The Reliable, High Performance TCP/HTTP Load Balancer
高级篇:(高可用性+高可扩展性的集群)
单点调度故障解决: 集群的好处显而易见,但是有一个弊端就是单节点进行调度,如果节点出现故障,则整个集群全部都无法服务,对此的解决方案,我们使用keepalived来解决。Keepalived for Linux keepalived是基于VRRP协议(VRRP协议介绍)的,请一定先了解VRRP协议后再进行配置。 keepalived可以把多台设备虚拟出一个IP,并自动在故障节点与备用节点之间实现failover切换。这样我们配置两台货多台lvs调度节点,然后配置好keepalived就可以做到lvs调度节点出现故障后,自动切换到备用调度节点。(同样适用于mysql)
memcache集群扩展解决: memcache因为我们一般采用的都是hash后除以节点数取余,然后分配到对应节点上,如果节点数出现变化,以前的缓存数据将基本都不能命中。 解决方法:consistent hashing 简介:一致性哈希
consistent hashing大概的思路就是,把hash后的值保证在 0 ~ (2^32)-1 的数值上,然后把这一连串数字对应映射到一个想象的圆上。
把要存储的各个值hash后,放到圆上,如图
然后把cache节点也用同样的hash方法,映射到圆上,然后每个刚才hash过的value顺时针寻找离自己最近的节点,这个节点就是存储它的节点。
为了提高存储的平衡性,算法还可以加入虚拟节点的概念,即每个实际cache节点,会在圆上对应N个虚拟的节点,这样可以提高算法的命中率,更加平衡。
consistent hashing原理:Consistent hashing and random trees
完结。 另:以上图片来自互联网,未找到原创者,故未标注来源。 欢迎署名转载。
月光博客6月12日发表了《写给新手程序员的一封信》,翻译自《An open letter to those who want to start programming》,我的朋友(他在本站的id是Mailper)告诉我,他希望在酷壳上看到一篇更具操作性的文章。因为他也是喜欢编程和技术的家伙,于是,我让他把他的一些学习Python和Web编程的一些点滴总结一下。于是他给我发来了一些他的心得和经历,我在把他的心得做了不多的增改,并根据我的经历增加了“进阶”一节。这是一篇由新手和我这个老家伙根据我们的经历完成的文章。
我的这个朋友把这篇文章取名叫Build Your Programming Technical Skills,我实在不知道用中文怎么翻译,但我在写的过程中,我觉得这很像一个打网游做任务升级的一个过程,所以取名叫“技术练级攻略”,题目有点大,呵呵,这个标题纯粹是为了好玩。这里仅仅是在分享Mailper和我个人的学习经历。(注:省去了我作为一个初学者曾经学习过的一些技术(今天明显过时了),如:Delphi/Power builder,也省去了我学过的一些我觉得没意思的技术Lotus Notes/ActiveX/COM/ADO/ATL/.NET ……)
前言
你是否觉得自己从学校毕业的时候只做过小玩具一样的程序?走入职场后哪怕没有什么经验也可以把以下这些课外练习走一遍(朋友的抱怨:学校课程总是从理论出发,作业项目都看不出有什么实际作用,不如从工作中的需求出发)
建议:
不要乱买书,不要乱追新技术新名词,基础的东西经过很长时间积累而且还会在未来至少10年通用。 回顾一下历史,看看历史上时间线上技术的发展,你才能明白明天会是什么样。 一定要动手,例子不管多么简单,建议至少自己手敲一遍看看是否理解了里头的细枝末节。 一定要学会思考,思考为什么要这样,而不是那样。还要举一反三地思考。 注:你也许会很奇怪为什么下面的东西很偏Unix/Linux,这是因为我觉得Windows下的编程可能会在未来很没有前途,原因如下:
现在的用户界面几乎被两个东西主宰了,1)Web,2)移动设备iOS或Android。Windows的图形界面不吃香了。 越来越多的企业在用成本低性能高的Linux和各种开源技术来构架其系统,Windows的成本太高了。 微软的东西变得太快了,很不持久,他们完全是在玩弄程序员。详情参见《Windows编程革命史》 所以,我个人认为以后的趋势是前端是Web+移动,后端是Linux+开源。开发这边基本上没Windows什么事。
启蒙入门
1、 学习一门脚本语言,例如Python/Ruby
可以让你摆脱对底层语言的恐惧感,脚本语言可以让你很快开发出能用得上的小程序。实践项目:
处理文本文件,或者csv (关键词 python csv, python open, python sys) 读一个本地文件,逐行处理(例如 word count,或者处理log) 遍历本地文件系统 (sys, os, path),例如写一个程序统计一个目录下所有文件大小并按各种条件排序并保存结果 跟数据库打交道 (python sqlite),写一个小脚本统计数据库里条目数量 学会用各种print之类简单粗暴的方式进行调试 学会用Google (phrase, domain, use reader to follow tech blogs) 为什么要学脚本语言,因为他们实在是太方便了,很多时候我们需要写点小工具或是脚本来帮我们解决问题,你就会发现正规的编程语言太难用了。
2、 用熟一种程序员的编辑器(不是IDE) 和一些基本工具
Vim / Emacs / Notepad++,学会如何配置代码补全,外观,外部命令等。 Source Insight (或 ctag) 使用这些东西不是为了Cool,而是这些编辑器在查看、修改代码/配置文章/日志会更快更有效率。
3、 熟悉Unix/Linux Shell和常见的命令行
如果你用windows,至少学会用虚拟机里的linux, vmware player是免费的,装个Ubuntu吧 一定要少用少用图形界面。 学会使用man来查看帮助 文件系统结构和基本操作 ls/chmod/chown/rm/find/ln/cat/mount/mkdir/tar/gzip … 学会使用一些文本操作命令 sed/awk/grep/tail/less/more … 学会使用一些管理命令 ps/top/lsof/netstat/kill/tcpdump/iptables/dd… 了解/etc目录下的各种配置文章,学会查看/var/log下的系统日志,以及/proc下的系统运行信息 了解正则表达式,使用正则表达式来查找文件。 对于程序员来说Unix/Linux比Windows简单多了。(参看我四年前CSDN的博文《其实Unix很简单》)学会使用Unix/Linux你会发现图形界面在某些时候实在是太难用了,相当地相当地降低工作效率。
4、 学习Web基础(HTML/CSS/JS) + 服务器端技术 (LAMP)
未来必然是Web的世界,学习WEB基础的最佳网站是W3School。
学习HTML基本语法 学习CSS如何选中HTML元素并应用一些基本样式(关键词:box model) 学会用 Firefox + Firebug 或 chrome 查看你觉得很炫的网页结构,并动态修改。 学习使用Javascript操纵HTML元件。理解DOM和动态网页(oreilly.com/catalog/978…) 网上有免费的章节,足够用了。或参看 DOM 。 学会用 Firefox + Firebug 或 chrome 调试Javascript代码(设置断点,查看变量,性能,控制台等) 在一台机器上配置Apache 或 Nginx 学习PHP,让后台PHP和前台HTML进行数据交互,对服务器相应浏览器请求形成初步认识。实现一个表单提交和反显的功能。 把PHP连接本地或者远程数据库 MySQL(MySQL 和 SQL现学现用够了) 跟完一个名校的网络编程课程(例如:www.stanford.edu/~ouster/cgi… ) 不要觉得需要多于一学期时间,大学生是全职一学期选3-5门课,你业余时间一定可以跟上 学习一个javascript库(例如jQuery 或 ExtJS)+ Ajax (异步读入一个服务器端图片或者数据库内容)+JSON数据格式。 HTTP: The Definitive Guide 读完前4章你就明白你每天上网用浏览器的时候发生的事情了(proxy, gateway, browsers) 做个小网站(例如:一个小的留言板,支持用户登录,Cookie/Session,增、删、改、查,上传图片附件,分页显示) 买个域名,租个空间,做个自己的网站。 进阶加深
1、 C语言和操作系统调用
重新学C语言,理解指针和内存模型,用C语言实现一下各种经典的算法和数据结构。推荐《计算机程序设计艺术》、《算法导论》和《编程珠玑》。 学习(麻省理工免费课程)计算机科学和编程导论 学习(麻省理工免费课程)C语言内存管理 学习Unix/Linux系统调用(Unix高级环境编程),,了解系统层面的东西。 用这些系统知识操作一下文件系统,用户(实现一个可以拷贝目录树的小程序) 用fork/wait/waitpid写一个多进程的程序,用pthread写一个多线程带同步或互斥的程序。多进程多进程购票的程序。 用signal/kill/raise/alarm/pause/sigprocmask实现一个多进程间的信号量通信的程序。 学会使用gcc和gdb来编程和调试程序(参看我的《用gdb调试程序》) 学会使用makefile来编译程序。(参看我的《跟我一起写makefile》) IPC和Socket的东西可以放到高级中来实践。 学习Windows SDK编程(Windows 程序设计 ,MFC程序设计) 写一个窗口,了解WinMain/WinProcedure,以及Windows的消息机制。 写一些程序来操作Windows SDK中的资源文件或是各种图形控件,以及作图的编程。 学习如何使用MSDN查看相关的SDK函数,各种WM_消息以及一些例程。 这本书中有很多例程,在实践中请不要照抄,试着自己写一个自己的例程。 不用太多于精通这些东西,因为GUI正在被Web取代,主要是了解一下Windows 图形界面的编程。@virushuo 说:“ 我觉得GUI确实不那么热门了,但充分理解GUI工作原理是很重要的。包括移动设备开发,如果没有基础知识仍然很吃力。或者说移动设备开发必须理解GUI工作,或者在win那边学,或者在mac/iOS上学”。 2、学习Java
Java 的学习主要是看经典的Core Java 《Java 核心技术编程》和《Java编程思想》(有两卷,我仅链了第一卷,足够了,因为Java的图形界面了解就可以了) 学习JDK,学会查阅Java API Doc download.oracle.com/javase/6/do… 了解一下Java这种虚拟机语言和C和Python语言在编译和执行上的差别。从C、Java、Python思考一下“跨平台”这种技术。 学会使用IDE Eclipse,使用Eclipse 编译,调试和开发Java程序。 建一个Tomcat的网站,尝试一下JSP/Servlet/JDBC/MySQL的Web开发。把前面所说的那个PHP的小项目试着用JSP和Servlet实现一下。 3、Web的安全与架构 学习HTML5,网上有很多很多教程,以前酷壳也介绍过很多,我在这里就不罗列了。 学习Web开发的安全问题(参考新浪微博被攻击的这个事,以及Ruby的这篇文章) 学习HTTP Server的rewrite机制,Nginx的反向代理机制,fast-cgi(如:PHP-FPM) 学习Web的静态页面缓存技术。 学习Web的异步工作流处理,数据Cache,数据分区,负载均衡,水平扩展的构架。 实践任务: 使用HTML5的canvas 制作一些Web动画。 尝试在前面开发过的那个Web应用中进行SQL注入,JS注入,以及XSS攻击。 把前面开发过的那个Web应用改成构造在Nginx + PHP-FPM + 静态页面缓存的网站 4、学习关系型数据库
你可以安装MSSQLServer或MySQL来学习数据库。 学习教科书里数据库设计的那几个范式,1NF,2NF,3NF,…… 学习数据库的存过,触发器,视图,建索引,游标等。 学习SQL语句,明白表连接的各种概念(参看《SQL Join的图示》) 学习如何优化数据库查询(参看《MySQL的优化》) 实践任务:设计一个论坛的数据库,至少满足3NF,使用SQL语句查询本周,本月的最新文章,评论最多的文章,最活跃用户。 5、一些开发工具
学会使用SVN或Git来管理程序版本。 学会使用JUnit来对Java进行单元测试。 学习C语言和Java语言的coding standard 或 coding guideline。(我N年前写过一篇关C语言非常简单的文章——《编程修养》,这样的东西你可以上网查一下,一大堆)。 推荐阅读《代码大全》《重构》《代码整洁之道》 高级深入
1、C++ / Java 和面向对象
我个人以为学好C++,Java也就是举手之劳。但是C++的学习曲线相当的陡。不过,我觉得C++是最需要学好的语言了。参看两篇趣文“C++学习信心图” 和“21天学好C++”
学习(麻省理工免费课程)C++面向对象编程 读我的 “如何学好C++”中所推荐的那些书至少两遍以上(如果你对C++的理解能够深入到像我所写的《C++虚函数表解析》或是《C++对象内存存局(上)(下)》,或是《C/C++返回内部静态成员的陷阱》那就非常不错了) 然后反思为什么C++要干成这样,Java则不是?你一定要学会对比C++和Java的不同。比如,Java中的初始化,垃圾回收,接口,异常,虚函数,等等。 实践任务: 用C++实现一个BigInt,支持128位的整形的加减乘除的操作。 用C++封装一个数据结构的容量,比如hash table。 用C++封装并实现一个智能指针(一定要使用模板)。 《设计模式》必需一读,两遍以上,思考一下,这23个模式的应用场景。主要是两点:1)钟爱组合而不是继承,2)钟爱接口而不是实现。(也推荐《深入浅出设计模式》) 实践任务: 使用工厂模式实现一个内存池。 使用策略模式制做一个类其可以把文本文件进行左对齐,右对齐和中对齐。 使用命令模式实现一个命令行计算器,并支持undo和redo。 使用修饰模式实现一个酒店的房间价格订价策略——旺季,服务,VIP、旅行团、等影响价格的因素。 学习STL的用法和其设计概念 - 容器,算法,迭代器,函数子。如果可能,请读一下其源码。 实践任务:尝试使用面向对象、STL,设计模式、和WindowsSDK图形编程的各种技能 做一个贪吃蛇或是俄罗斯方块的游戏。支持不同的级别和难度。 做一个文件浏览器,可以浏览目录下的文件,并可以对不同的文件有不同的操作,文本文件可以打开编辑,执行文件则执行之,mp3或avi文件可以播放,图片文件可以展示图片。 学习C++的一些类库的设计,如: MFC(看看候捷老师的《深入浅出MFC》) ,Boost, ACE, CPPUnit,STL (STL可能会太难了,但是如果你能了解其中的设计模式和设计那就太好了,如果你能深入到我写的《STL string类的写时拷贝技术》那就非常不错了,ACE需要很强在的系统知识,参见后面的“加强对系统的了解”) Java是真正的面向对象的语言,Java的设计模式多得不能再多,也是用来学习面向对象的设计模式的最佳语言了(参看Java中的设计模式)。 推荐阅读《Effective Java》 and 《Java解惑》 学习Java的框架,Java的框架也是多,如Spring, Hibernate,Struts 等等,主要是学习Java的设计,如IoC等。 Java的技术也是烂多,重点学习J2EE架构以及JMS, RMI, 等消息传递和远程调用的技术。 学习使用Java做Web Service (官方教程在这里) 实践任务: 尝试在Spring或Hibernate框架下构建一个有网络的Web Service的远程调用程序,并可以在两个Service中通过JMS传递消息。 C++和Java都不是能在短时间内能学好的,C++玩是的深,Java玩的是广,我建议两者选一个。我个人的学习经历是:
深究C++(我深究C/C++了十来年了) 学习Java的各种设计模式。 2、加强系统了解
重要阅读下面的几本书:
《Unix编程艺术》了解Unix系统领域中的设计和开发哲学、思想文化体系、原则与经验。你一定会有一种醍醐灌顶的感觉。 《Unix网络编程卷1,套接字》这是一本看完你就明白网络编程的书。重要注意TCP、UDP,以及多路复用的系统调用select/poll/epoll的差别。 《TCP/IP详解 卷1:协议》- 这是一本看完后你就可以当网络黑客的书。了解以太网的的运作原理,了解TCP/IP的协议,运作原理以及如何TCP的调优。 实践任务: 理解什么是阻塞(同步IO),非阻塞(异步IO),多路复用(select, poll, epoll)的IO技术。 写一个网络聊天程序,有聊天服务器和多个聊天客户端(服务端用UDP对部分或所有的的聊天客户端进Multicast或Broadcast)。 写一个简易的HTTP服务器。 《Unix网络编程卷2,进程间通信》信号量,管道,共享内存,消息等各种IPC…… 这些技术好像有点老掉牙了,不过还是值得了解。 实践任务: 主要实践各种IPC进程序通信的方法。 尝试写一个管道程序,父子进程通过管道交换数据。 尝试写一个共享内存的程序,两个进程通过共享内存交换一个C的结构体数组。 学习《Windows核心编程》一书。把CreateProcess,Windows线程、线程调度、线程同步(Event, 信号量,互斥量)、异步I/O,内存管理,DLL,这几大块搞精通。 实践任务:使用CreateProcess启动一个记事本或IE,并监控该程序的运行。把前面写过的那个简易的HTTP服务用线程池实现一下。写一个DLL的钩子程序监控指定窗口的关闭事件,或是记录某个窗口的按键。 有了多线程、多进程通信,TCP/IP,套接字,C++和设计模式的基本,你可以研究一下ACE了。使用ACE重写上述的聊天程序和HTTP服务器(带线程池) 实践任务:通过以上的所有知识,尝试 写一个服务端给客户端传大文件,要求把100M的带宽用到80%以上。(注意,磁盘I/O和网络I/O可能会很有问题,想一想怎么解决,另外,请注意网络传输最大单元MTU) 了解BT下载的工作原理,用多进程的方式模拟BT下载的原理。 3、系统架构
负载均衡。HASH式的,纯动态式的。(可以到Google学术里搜一些关于负载均衡的文章读读) 多层分布式系统 – 客户端服务结点层、计算结点层、数据cache层,数据层。J2EE是经典的多层结构。 CDN系统 – 就近访问,内容边缘化。 P2P式系统,研究一下BT和电驴的算法。比如:DHT算法。 服务器备份,双机备份系统(Live-Standby和Live-Live系统),两台机器如何通过心跳监测对方?集群主结点备份。 虚拟化技术,使用这个技术,可以把操作系统当应用程序一下切换或重新配置和部署。 学习Thrift,二进制的高性能的通讯中间件,支持数据(对象)序列化和多种类型的RPC服务。 学习Hadoop。Hadoop框架中最核心的设计就是:MapReduce和HDFS。MapReduce的思想是由Google的一篇论文所提及而被广为流传的,简单的一句话解释MapReduce就是“任务的分解与结果的汇总”。HDFS是Hadoop分布式文件系统(Hadoop Distributed File System)的缩写,为分布式计算存储提供了底层支持。 了解NoSQL数据库(有人说可能是一个过渡炒作的技术),不过因为超大规模以及高并发的纯动态型网站日渐成为主流,而SNS类网站在数据存取过程中有着实时性等刚性需求,这使得目前NoSQL数据库慢慢成了人们所关注的焦点,并大有成为取代关系型数据库而成为未来主流数据存储模式的趋势。当前NoSQL数据库很多,大部分都是开源的,其中比较知名的有:MemcacheDB、Redis、Tokyo Cabinet(升级版为Kyoto Cabinet)、Flare、MongoDB、CouchDB、Cassandra、Voldemort等。 写了那么多,回顾一下,觉得自己相当的有成就感。希望大家不要吓着,我自己这十来年也在不断地学习,今天我也在学习中,人生本来就是一个不断学习和练级的过程。不过,一定有漏的,也有不对的,还希望大家补充和更正。(我会根据大家的反馈随时更新此文)欢迎大家通过我的微博(@左耳朵耗子)和twitter(@haoel)和我交流。
—– 更新 2011/07/19 —–
1)有朋友奇怪为什么我在这篇文章开头说了web+移动,却没有在后面提到iOS/Android的前端开发。因为我心里有一种感觉,移动设备上的UI最终也会被Javascript取代。大家可以用iPhone或Android看看google+,你就会明白了。
2)有朋友说我这里的东西太多了,不能为了学习而学习,我非常同意。我在文章的前面也说了要思考。另外,千万不要以为我说的这些东西是一些新的技术,这份攻略里95%以上的全是基础。而且都是久经考验的基础技术。即是可以让你一通百通的技术,也是可以让你找到一份不错工作的技术。
3)有朋友说学这些东西学完都40了,还不如想想怎么去挣钱。我想告诉大家,一是我今年还没有40岁,二是学无止境啊,三是我不觉得挣钱有多难,难的是怎么让你值那么多钱?无论是打工还是创业,是什么东西让你自己的价值,让你公司的价值更值钱?别的地方我不敢说,对于互联网或IT公司来说,技术实力绝对是其中之一。
4)有朋友说技术都是工具,不应该如此痴迷这句话没有错,有时候我们需要更多的是抬起头来看看技术以外的事情,或者是说我们在作技术的时候不去思考为什么会有这个技术,为什么不是别的,问题不在于技术,问题在于我们死读书,读死书,成了技术的书呆子。
5) 对于NoSQL,最近比较火,但我对其有点保守,所以,我只是说了解就可以。对于Hadoop,我觉得其在分布式系统上有巨大的潜力,所以需要学习。 对于关系型数据库,的确是很重要的东西,这点是我的疏忽,在原文里补充。
(全文完,转载时请注明作者和出处)
关于PHP程序员解决问题的能力 这个话题老生长谈了,在面试中必然考核的能力中,我个人认为解决问题能力是排第一位的,比学习能力优先级更高。解决问题的能力既能看出程序员的思维能力,应变能力,探索能力等,又可以看出他的经验。如果解决问题能力不佳是无法通过面试的。 这里举个例子,假如我执行了一个PHP的脚本,如php test.php,预期是可以返回一个字符串。但执行后没有任何信息输出,这时候通过什么方法能知道程序错在哪里?这里可以将解决问题能力分为8个等级,越到后面的表示能力越强。
Lv0 查看PHP错误信息 程序没有达到预期效果,证明代码出错了,看PHP的错误信息是第一步。如果直接忽略错误信息,表明这个人不适合担任专业的程序员岗位。有些情况下php.ini配置中关闭了错误显示,需要修改php.ini打开错误信息,或者错误信息被导出到了日志文件,这种情况可以直接tailf php_error.log来看错误信息。
拿到错误信息后直接定位到程序代码问题,或者到Google/百度搜索,即可解决问题。
注:打开错误显示的方法是
php.ini中display_errors / display_startup_errors 设置为On php.ini中error_reporting 设置为E_ALL PHP代码中设置error_reporting(E_ALL) Lv1 存在多个版本的php或php-cli与php-fpm加载不同的配置 存在多个版本的php,懂得通过which php来看是哪个PHP,或者加绝对路径制定php版本。表示此PHPer通过了此层级的50%考验。
另外一个情况就是php-cli与php-fpm得到的执行情况不一样,如在web浏览器中执行是对的,cli下执行是错的。这时候可能是2个环境加载的php.ini不同所致。cli下通过php -i |grep php.ini得到加载了哪个php.ini。而fpm下通过phpinfo()函数可以得到php.ini的绝对路径。
Lv2 var_dump/die打印变量值信息单步调试 这是惯用的程序调试手段,也是最简单粗暴有效的解决问题方法。高级一点的手段是使用PHP的Trace类/日志类,花哨一点的可以借助phpstorm+xdebug在IDE工具里进行Debug。
Trace工具还可以分析脚本的耗时,进行PHP程序的性能优化。
这3个考验全部通过,表明此程序员已经具备了专业PHP程序员应该有的解决问题能力了。PHP程序员只要过了这个等级,就足以应多大部分情况,在中小型网站中毫无压力。
Lv3 使用strace工具跟踪程序执行 strace可以用来查看系统调用的执行,使用strace php test.php,或者strace -p 进程ID。strace就可以帮助你透过现象看本质,掌握程序执行的过程。这个手段是在大型网站,大公司里最常用的。如果没掌握strace,这里只能说抱歉了,我们不接受不会strace的PHPer。
strace其实也是对程序员基础的考验,如果不懂操作操作系统,完全不懂底层,肯定也达不到会用strace的程度。当然strace对于PHP代码里的死循环是解决不了的。比如你发现一个php-fpm进程CPU100%了,strace恐怕是解决不了的。因为strace是看系统调用,一般都是IO类操作,既然是IO密集,那CPU一定不可能是100%。
Lv4 使用tcpdump工具分析网络通信过程 tcpdump可以抓到网卡的数据通信过程,甚至数据内容也可以抓到。使用tcpdump可以看到网络通信过程是什么样的,如何时发起了TCP SYN3次握手,何时发送FIN包,何时发送RST包。这是一个基本功,如果不懂tcpdump,证明不具备网络问题解决能力。
Lv5 统计函数调用的耗时和成功率 使用xhporf/xdebug导出PHP请求的调用过程,然后分析每个函数调用的过程和耗时。能够分析PHP程序的性能瓶颈,找出可以优化的点。
另外一个对于网络服务的调用,如mysql查询,curl,其他API调用等,通过记录起始和结束时microtime,返回的是不是false,可以得到调用是否成功,耗时多少。如果可以汇总数据,整理出调用的成功率,失败率,平均延时,证明此程序员对接口质量敏感,有大型网站项目经验。
Lv6 gdb使用 gdb是C/C++调试程序的利器,需要具备一定C/C++功底的程序员才会能熟练使用gdb。上面说的strace无法跟踪php程序CPU100%,而gdb是可以跟踪的。另外gdb也可以解决php程序core dump的问题。
通过gdb -p 进程ID,再配合php-src的.gdbinit zbacktrace等工具,可以很方便地跟踪PHP程序的执行。像上面的CPU100%往往是PHP程序中发生死循环了,gdb进行多次查看,就大致可以得到死循环的位置。具备gdb解决问题能力的PHP程序员少之又少。如果能使用gdb解决PHP问题,这个PHPer百分之百可以通过面试,并且可以拿到较高的技术评级。
Lv7 查看PHP内核和扩展源码 如果能熟悉PHP内核和扩展的源码,遇到PHP程序中最复杂的内存错误,也可以有解决的能力。这类PHP程序员就是凤毛麟角了。配合gdb工具和对PHP源码的熟悉,可以查看opcode的信息,execute_data的内存,全局变量的状态等。
=========================================================================================================
大型网站运营的技术经验分享
一、日志系统 对于一个大型网站来说,代码库非常庞大,模块众多。部门协作的人数规模在百人以上,如何跟踪定位问题不像小网站那样容易。而且我们的服务器都是集群化的,动辄几千台。有一套可查询方便使用的日志系统至关重要。
对于日志的使用也有了一定的经验。我们的日志通常会非常详细的记录各种参数,环境变量,HOST等信息,在出现异常的情况下,必须要记录日志。我们使用了MySQL按时间分片的方式来记录日志,所有集群内节点均通过网络方式来写入到中心日志系统。
在管理端我们提供了很方便友好的工具,来查询定位日志,可按用户ID、类型、时间等几种索引方式查询。日志系统帮助我们定位到了很多问题。
二、PHP错误日志收集系统 PHP错误日志是所有PHP程序问题最直接的反馈渠道。通过分析PHP日志可以发现和分析出系统现有的Bug和潜在的问题。我们通过在节点部署监控工具,实时收集PHP错误日志,Fatal Error告警。解决了很多问题
三、数据统计中心 我们有一整套数据上报的系统,系统内各种接口调用、请求响应、错误返回,都会上报到数据统计中心。我们以报表的形式展现出来,可以很方便的看到每个模块,每个接口的可用性,成功率,数据规模。根据数据,我们还做了成功率告警,当接口成功率低于某个数值,比如99.99%时就会发送短信报警。还有历史数据对比报警,当发现今日数据与往期数据差距较大时,可能是系统出现了问题,会及时进行报警。
四、硬件系统报警 我们有一套工具,来监控每个服务器节点的CPU、硬盘、内存、网卡流量信息,以及其他系统关键参数的信息。并以图表方式提供展示,方便了解服务器运行情况。每次新版本,或新功能上线,都通过这些信息来感知访问量变化,以及机器的负载情况。
五、容灾工具 当一组Server中其中一台出现问题时,会及时发现,并踢掉。这个也可以做成自动容灾,不过控制不好会发生雪崩。 ————————————————
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。