orczhou

  • Google Trends数据一瞥

    ·

    logo
    Google除了给我们提供搜索服务之外,还有大大小小很多的有意思的产品,Google Trends就是其中一个。

    前两天beenhero同学花了点时间把Google Trends 每天的热门数据(Hot Trends)全爬过来了,想让我帮忙建立个简单的模型进行一些分析。

    Hot TrendsGoogleTrends根据当天用户搜索的关键字,给出的”搜索关键字”排行榜。为了避免数据平庸(最热门往往类似于”天气”等内容),Google自己已经做了一些处理,偏向于显示突然增长的搜索结果。希望能够根据关键字出现的频率、时间和榜上排名,给出一个GoogleTrends中最受关注的前几名。

    (more…)

  • 分页优化的四种方式

    ·

    很久以前读了一篇关于分页的文章,后来越想越有道理,最近又重新找出来,并做了翻译,原文参考:Four ways to optimize paginated displays.

    翻译背景:在大数据量的情况下,原本很简单的分页如果没有处理好,你会发现分页的请求会消耗你大量的数据库时间。如果你遇到了这个问题,文章给了你几个很好的解决的方案。当然,初学者若能看完这篇文章,那么它会指导你写出更具有扩展性的分页代码。

    全文概述:文中提到了分页的办法总结如下:

    1. 全部缓存查询结果。把查询结果全部缓存起来(例如文件缓存、静态化结果页面等)。
    2. 不详细显示总共有多少分页。这里有两个优化的技巧。其一每次在计算总条目的时候,我就固定查询501条,然后将前500条分页显示好,如果第501条确实存在,那么给出按钮 “查看更多…”(这种情况会很少)。其二,在每次列表本页面的时候,比如第一页我要显示1-20条,那么我查询出1-21条。如果第21条真的存在,我就给出”下一页”按钮,依次类推。
      (more…)
  • 在php中常见的计算字符串长度的函数有:strlen和mb_strlen,下面是对这两个函数的比较说明(编码方式UTF8)

    • 比较strlen和mb_strlen
      当字符全是英文字符的时候,两者是一样。这里主要比较一下,中英文混排的时候,两个计算结果。(测试时编码方式是UTF8)
      (more…)