#63 - 与微搜索创始人丁彦聊搜索引擎技术

Episode 63 · October 19th, 2014 · 1 hr 29 mins

About this Episode

本期由玎玎支持,邀请到了微搜索的创始人丁彦来 Teahour 做客,聊聊构建搜索引擎的基本知识。

微搜索是一个站内(应用内)搜索云服务,大家在听这期节目前,可以尝试一下 Teahour 网站的搜索功能,使用的就是微搜索的服务。搜索引擎是我们用来查询信息的工具,简单说来,做一个搜索引擎,分成三步,即信息搜集、信息整理和支持查询。本期节目中,丁彦介绍了他做微搜索服务时对于搜索引擎实现的经验分享,抓取信息内容的实现、索引信息的实现和实际搜索的实现。

  1. 微搜索
  2. Dotide
  3. 东南大学
  4. 开源软件与 GitCafe
  5. Ruby China
  6. Google Custom Search
  7. Crawler
  8. 深度优先
  9. 广度优先
  10. Inverted Index
  11. Tokenize
  12. 中文分词
  13. ik
  14. mmseg
  15. sphinx
  16. whoosh
  17. lucene
  18. Solr
  19. ElasticSearch
  20. 微搜索计划
  21. Calibre
  22. RubyConf China