这本书是一本肤浅的研究报告汇编,数据图表虽然不少,单分析方法简单,结论不用分析其实也都知道,缺乏深刻的、有独创性的见解。
作者提出的三个概念“历程扩散”、“深描分析”和“族群”也让人看得云里雾里:
比如“历程扩散”在书中都是以单变量对单变量的图形表示,如“某产品的使用比例-年龄”,恕我愚昧,实在没看明白作者是怎么用的所谓logistic模型,如果仅仅是单自变量的logistic回归模型,那还不如直接用概率分布图来的简单,如果是个体指随年龄变化而变化的消费倾向,从作者使用的数据上看又似乎不支持(作者使用的是2011年的横截面数据)。
至于“深描分析”和“族群”,作者也未说明这一族群的准确定义或者是定义的方法,看上去就好像是作者随意的划分(见书P195),对于每个“族群”,也只是简单分析了一些特征,实在难说有什么价值。
最后,作者的整本书建立在《第一象限2011手机人调查》,通篇所有的分析都用到了这5241个样本,同样的5241个样本,能横竖分析出这么一本书的内容,可以想见被调查人需要面对的是多么厚的一叠问卷,而这让我对于其对数据质量表示疑问。
总之,这本书更像是一个三流研究生用来应付毕业的论文。
PS:写完之后发现第一作者后面还有三个名字,希望不要被言中。
to pulupulu:
1. “摆弄那些“其他”的解释变量可以得出各种你想要的结果。”
真心不同意楼上关于这种危险的观点。请参阅各种统计模型的书籍关于遗落重要变量的问题。统计虽然可以‘骗人’,但不是任人摆弄的小姑娘,摆弄过这种小伎俩的人,结果多为统计所摆弄。
2. ”你不告诉别人你用的是哪个,然后就画一个“使用比例-年龄”的图,完全没有意义。“
写作可以有多种方式,但必须遵循最基本的原则。同意附录报告全模型。但楼上须知,写给市场用的书,但报告一堆非线性的tables of regression,别人能直观理解吗?
回复:黠之大者
用计量模型来支撑分析最起码要说明模型是什么。所谓的“控制其他变量”,学过统计和计量的人都应该知道,摆弄那些“其他”的解释变量可以得出各种你想要的结果。
举个例子,你用“某产品的使用比例”,对“年龄+收入”回归(模型I),和对“年龄+性别”(模型II)回归,画出来的”使用比例-年龄“的图肯定不一样,这样的模型有各种各样的,你不告诉别人你用的是哪个,然后就画一个“使用比例-年龄”的图,完全没有意义。从读者角度来看,信息量还真不如最简单的条件概率表示大。
To lz: Your comment is misleading and not fair. 比如“历程扩散”在书中都是以单变量对单变量的图形表示,如“某产品的使用比例-年龄”.
To be frank and no offence, you actually don't really understand how the figures are drawn. It's drawn based on the prediction of multiple non-linear regression, rather than binary variables. Although it's demonstrated with only two variables, the other factors have been controlled.
However, it's normal to have such misunderstandings, since most of Chinese scholars and researchers avoid or neglect this method based on which we can have '个体指随年龄变化而变化的消费倾向' without panel data.
'那还不如直接用概率分布图来的简单', without controlling other factors, your suggestions will be spurious.
同感 但是没有lz说的那么严重 感觉分析的比较肤浅 之前对这本书抱有很大期望来着 互联网时间瞬息万变 书里的数据全是11年的数据 真心老旧 手机市场份额的那张表居然还是诺基亚占主导 有点露怯……