了解日本 Web 相关开发技术的窗口
2011-09-14
Disclaimer: 偶是本书审校.
越是不了解日本网站及相关技术的人, 在书中能够读到的就越少. 虽然这话很是打击...
可能大家注意到了, 书中很多地方提到了技术评论社的杂志, Web+DB Press.
有些一笔带过的东西在后期也出现在杂志上了. 比如最新一期(64) 上刊载了 PFI 的 @tkng 写的日文输入法相关话题的文章.
关于三个课题.
VB Code 是初级水平, 有能力的可以试试别的编码方式. 但是你是否理解 msgpack 的设计? 虽然 msgpack 和 protobuf 并非直接可比, 后者是直接针对 RPC 设计的, 而前者不是.
Aho-Corasick 可以认为是 Hatena 的专属课题. 自制实现感觉意义并非很大. 不过说以词典生成 trie/自动机, 那么这个 trie 还能不能干别的? 如果能的话还能做什么?
搜索引擎课题是跟着上两个课题来的. 前面如果有优化的话都可以应用在这上面. 面向实习的课题做基于逆向/倒排索引的搜索引擎, 这个没有什么可说的. 可是, 书中已经提到 Hatena Bookmarks 浏览器插件, 之前使用了 Induced Sort 法做本地书签搜索的索引, 要不要试试看? 如果这个难度还不够, 那就生成 CSA 看看, 了解下这个究竟有多困难, 为什么与 PFI 使用相似算法的竞争对手极其罕见, 连这个插件都以规模为理由放弃了.
自认为资深的, 强到可以不读这本书的, 可以试着挑战一下上面新出的问题. 作者们认为不适合讲给实习生的, 难度比较大的内容(也许), 偶试着在这里揭露一部分.
作者们可以笑着讲过去, 你不仔细研究就是你的问题.