数据工程师必知算法:蓄水池抽样
2013/06/21 · IT技术, 开发 · 1 条评论
引言:众所周知,想要面试一个统计学家和软件工程师的合体——数据工程师——是件很难的事情。我在面试中常使用的方法是:提出即需要算法设计,又需要一些概率论知识的问题,来考察面试者的功底。下面就是在硅谷非常流行的例子:
“给出一个数据流,这个数据流的长度很大或者未知。并且对该数据流中数据只能访问一次。请写出一个随机选择算法,使得数据流中所有数据被选中的……
简明解释算法中的大O符号
2013/06/21 · IT技术 · 5 条评论
伯乐在线导读:2009年1月28日Arec Barrwin在StackOverflow上提问,“有没有关于大O符号(Big O notation)的简单解释?尽量别用那么正式的定义,用尽可能简单的数学来解释”。在经过众多热心网友的修改更新后,最佳回复的得分已高达 3234 分,详细内容,请见下文。
字符串匹配的Boyer-Moore算法
2013/06/20 · 开发 · 16 条评论
上一篇文章,我介绍了KMP算法。
但是,它并不是效率最高的算法,实际采用并不多。各种文本编辑器的”查找”功能(Ctrl+F),大多采用Boyer-Moore算法。
视觉直观感受 7 种常用的排序算法
2013/04/01 · IT技术, 开发 · 2 条评论
本文通过动态图介绍了7种常用排序算法。快速排序、归并排序、堆排序、选择排序、冒泡排序、插入排序和希尔排序。
缓存、缓存算法和缓存框架简介
2013/03/30 · IT技术 · 8 条评论
我们都听过 cache,当你问他们是什么是缓存的时候,他们会给你一个完美的答案,可是他们不知道缓存是怎么构建的,或者没有告诉你应该采用什么标准去选择缓存框架。在这边文章,我们会去讨论缓存,缓存算法,缓存框架以及哪个缓存框架会更好。
MySQL索引背后的数据结构及算法原理
2013/03/28 · IT技术 · 17 条评论
本文以MySQL数据库为研究对象,讨论与数据库索引相关的一些话题。特别需要说明的是,MySQL支持诸多存储引擎,而各种存储引擎对索引的支持也各不相同,因此MySQL数据库支持多种索引类型,如BTree索引,哈希索引,全文索引等等。为了避免混乱,本文将只关注于BTree索引,因为这是平常使用MySQL时主要打交道的索引,至于哈希索引和全文索引本文暂不讨论。
张洋:浅析PageRank算法
2013/03/26 · IT技术 · 6 条评论
很早就对Google的PageRank算法很感兴趣,但一直没有深究,只有个轮廓性的概念。前几天趁团队outing的机会,在动车上看了一些相关的资料(PS:在动车上看看书真是一种享受),趁热打铁,将所看的东西整理成此文。
SEOMoz:Google搜索算法变迁史
2013/02/05 · 营销
Google每年的算法改变高达五六百次,只不过很多改动都很小。但每隔几个月,Google都会做一次比较大的算法升级,这些升级都会直接影响到搜索的排名结果。
解构推荐系统:“猜你喜欢”是怎么猜中你的心思
2012/11/22 · IT技术
如今,到网上购物的人已经习惯了收到系统为他们做出的个性化推荐。Netflix 会推荐你可能会喜欢看的视频。TiVo 会自动把节目录下来,如果你感兴趣就可以看。Pandora 会通过预测我们想要听什么歌曲从而生成个性化的音乐流。
蚂蚁觅食和互联网算法
2012/08/29 · 业界 · 1 条评论
人类和蚂蚁的区别是什么?蚂蚁没有互联网。相对于拥有创造性思维的人类,蚂蚁看起来不过是依赖于本能的生物。不过,斯坦福大学两位科学家发现,蚂蚁比我们想象的要聪明的多,虽然它们没有发明互联网,但是却懂得互联网上的算法。在斯坦福大学网站上,讲述了这个有趣的发现
赵劼:我看面试时出(纯)算法题
2012/08/23 · 开发 · 1 条评论
今天早上一边出门一边在平板上读了左耳朵耗子的新文章《为什么我反对纯算法面试题》,略有想法。正逢外面暴雨如注,我就又回屋打开笔记本发了一些回复,特此整理一下。为了避免有人曲解我的看法,我先声明我并不是反对这篇文章,相反我是基本同意其中的观点,只不过会加以一些补充,把其中一些我认为有些过头的地方按一按。
陈皓:为什么我反对纯算法面试题
2012/08/22 · 开发 · 2 条评论
算法面试可能是微软搞出来的面试方法,现在很多公司都在效仿,而且我们的程序员也乐于解算法题,我个人以为,这是应试教育的毒瘤!我在《再谈“我是怎么招程序员”》中比较保守地说过,“问难的算法题并没有错,错的很多面试官只是在肤浅甚至错误地理解着面试算法题的目的。”,今天,我想加强一下这个观点——我反对纯算法题面试!(注意,我说的是纯算法题)
Reddit 评论排名算法
2012/07/30 · 开发 · 1 条评论
这篇文章介绍了Reddit的排名算法,今天继续上一篇文章,需要学习的是Reddit的评论排名算法。与文章新闻类排名不同的是,评论类的算法可能发表时间没有什么关系。
计算机在做些什么:建模、连接、交互利用
2012/06/28 · IT技术
在计算机领域,每隔30年,就会卷起一场计算运用新浪潮。上世纪50年代,人们为物质世界建模;80年代,人们设法利用计算机增强的彼此的联系;在新世纪的2010年,计算应用翻开了与物质世界交互利用的新篇章。未来的计算机科学发展将为我们带来什么?它又需要什么样的设备、方法和技术的支持?看图灵奖获得者Butler Lampson对这些问题的思考。
Simhash算法原理和网页查重应用
2012/06/15 · IT技术
传统的hash算法只负责将原始内容尽量均匀随机地映射为一个签名值,原理上相当于伪随机数产生算法。产生的两个签名,如果相等,说明原始内容在一定概率下是相等的;如果不相等,除了说明原始内容不相等外,不再提供任何信息,因为即使原始内容只相差一个字节,所产生的签名也很可能差别极大。
顾森:稳定婚姻问题和Gale-Shapley算法
2012/06/07 · 开发
什么是算法?每当有人问作者这样的问题时,他总会引用这个例子:假如你是一个媒人,有若干个单身男子登门求助,还有同样多的单身女子也前来征婚。如果你已经知道这些女孩儿在每个男孩儿心目中的排名,以及男孩儿们在每个女孩儿心中的排名,你应该怎样为他们牵线配对呢?
浅谈网页搜索排序中的投票模型
2012/05/29 · 开发
前些天读了一本《选举的困境》,其中有一章,从美国的选举制度说起,介绍美国选举制度的不足,然后针对其不足,提出种种改善,然而每种改善都有其各自的问题,其中的变化很有趣。
.Net Android App Bug C++ C sharp CSS C语言 Facebook featuredpost Git Github Go Google Hadoop HTML5 iOS IT java Javascript jQuery Linux MySQL Nginx Node.js NoSQL php Python Redis shell soho SQL SQL Server UI UI设计 Vim Web Web开发 书籍 互联网 交互设计 产品 产品经理 代码 分布式 创业 前端 团队 大数据 女程序员 威客 学习 安全 安卓开发 客户 屌程 工具 工程师 开发人员 开源 微软 技术面试 招聘 效率 教程 数学 数据库 数据结构 时间管理 服务器 机器学习 架构 测试 浏览器 游戏 用户 用户体验 界面 码农故事 移动应用 移动端 程序员 算法 管理 编程 编程语言 网站 网页设计 职场 自由职业 苹果 设计 设计师 设计模式 趣文 软件开发 重构 面试 项目经理 黑客
地址 1.1.1.1,Cloudflare 推新公共 DNS 服务
04/02 · 16 · 4
安卓用 Java 侵犯甲骨文版权,谷歌或赔 88 亿美元
03/28 · 17
李文星家属诉 BOSS直聘:哪怕赔一分 能给个交代也值
03/27 · 22 · 1
Android Studio 3.1 正式发布,默认使用 D8 Dex...
03/27 · 11
GitLab 发布全球开发者报告:开源仍是主流
03/25 · 7