中国人民大学统计学院 “统计大讲堂”系列讲座第一百三十九讲——“数据科学专题”第一讲
摘要:本次报告的标题借用了塔勒布一本书的书名《随机漫步的傻瓜》。坦白讲,作为一名披着“数据科学家”外衣的码农,我已经若干年不碰中心极限定理和实际数据,所以来讲一场数据科学的报告让我感到有些惶恐。塔勒布这本书给了我很多启发,所以我想借此机会分享我在这十八年统计与码农路上与数据科学直接或间接相关的一些随机经验与观察。当然,如果真按照塔勒布这本书的精神来考核,听众则应该对这场报告持高度怀疑态度,毕竟样本量为一(即:我一个人的经验)的数据连样本方差都没法算,就更不必说有多少置信度了。尽管随机性可能大得离谱,但我还是希望对听众有所启发,尤其是数据科学家的一些软技能(如营销)以及软件技能(如网页技术)。