第五节 研究方法论
本研究为实证研究,使用定量定性相结合的研究方法,收集有关中产阶层消费模式的数据,并试图联系社会结构和社会文本来解释这些发现。定量数据主要来自三套全国随机抽样调查数据,定性数据来自作者于2008年在北京做的30个半结构式访谈。本节将论述研究使用的方法论和具体的研究方法。首先,将讨论定量和定性研究方法结合的可行性与在本研究的应用,然后分别介绍定量和定性数据的来源、分析方法和数据质量的评估。
很多学科都涉足中国消费者的研究,包括商业科学、社会学和人类学。英文文献中有大量商业科学和市场学的相关研究,大都采用定量的研究方法,例如使用量表法研究消费者的心理(比如Tam, 2005; Yao and Wang, 2000)以及收集调查数据研究消费者的行为(比如Chow et al., 2001;Shen, 2002; McEwen, 2006; Zhou, 2003; Fan and Xiao, 1998)。相反,国外的社会学家和人类学家在研究中国的消费文化时偏爱定性的方法(比如Davis, 2005; Ngai, 2003; Fan, 2000),可能因为在中国收集大规模随机抽样数据有一定难度。而国内的学者则凭借在数据收集方面的优势,更热衷于定量的方法,将关注点放在中产阶层的消费行为(刘世雄,2007;朱晓辉,2006;零点调查,2006)。近年来,国内学术界在消费模式的研究中开始重视定量和定性方法的结合(郑红娥,2006;周晓虹,2005;王建平,2007;赵卫华,2007),一般包括收集调查数据和个案访谈,有的还包括参与式观察的方法。可是在这股潮流中,很多研究并未充分说明为什么要使用混合研究方法以及所使用的方法论。
在国外的消费文化研究中,定量定性相结合的研究方法得到广泛应用并被证实有效地达到了结论的连贯性(见Bennett et al., 2009; Silva et al., 2009; Warde and Martens, 2000)。如柏森(Pawson, 2008: 120)总结,研究者将定量和定性的方法结合的主要原因是出于一种被大多数研究者所认可的观点:社会是多面的(multi-faceted)、多层次的(multi-layered)、多视角的(multi-perspectival)。因此,学术界需要那些能够融合各种形式的材料和证据并能整合当前多种研究视角的研究方法。在这种哲学观点的基础上,研究者针对具体的研究目的将这两种方法以不同形式相结合,并根据不同的理论原则为这种方法论辩护。布莱曼(Bryman, 2008: 91-92)曾对现有的一些期刊论文进行过研究,发现大多数的融合定量定性方法的研究是为了“强化”(使用定性或者定量的方法收集更多数据来增强定量或者定性方法的研究发现)、“完整”(如果既使用定量方法也使用定性方法可能使得研究的解释更为全面)以及“三角测量法”(综合定量和定性的研究方法对研究发现进行三角测量,这些发现之间或许可以互相确证)。
但是,传统观点认为,定量和定性方法的本体论与认识论互不相容,因此二者之间有个不可逾越的“鸿沟”,这使得定量定性相结合的方法常常受到挑战。表1-1显示了定量和定性方法在认识论和本体论上不同的倾向。习惯上,定量方法与客观主义相联系,通过收集“客观的”观察资料来理解这个世界;而定性方法与建构主义相联系,致力于发现意义和解释以及动机和目的。
表1-1 定量和定性研究策略的根本区别
资料来源:布莱曼(Bryman, 2001: 20)。
无论如何,定量和定性方法之间的区别并没有带来二者相结合的研究方法的无效。如布莱曼(Bryman, 2001)认为,就认识论和本体论来讲,研究方法比研究者通常认为的要更加有“流动性”。例如,定性研究很有可能与经验主义和实用主义结合,通过可观察的现象并联系内在的结构和机制来解释世界;定量研究也可能与解释主义和建构主义结合,来发现意义、动机、解释以及为人们的行动提供倾向的规则。
对此,博格曼(Bergman, 2008)做出了更为系统的论述,建议在混合研究方法的应用中“混合”数据收集方法和数据分析方法,而不是“混合”边界模糊的定量和定性方法,这给研究者们提供了一种全新的视角。根据博格曼(Bergman, 2008: 14-15),传统的关于定量和定性方法的分工应当被抛弃,而且建立在此基础上的混合研究方法的前提也是错误的。事实上,每一种定量或者定性方法的实践都相去甚远,也很难为整个的定量方法大家庭或者定性方法大家庭总结出彼此区别的特征。在此观点基础上,博格曼(Bergman, 2008: 17)建议了混合方法研究中的两个主要原则。第一个原则是区分“数据收集方法”(比如,无结构式口述访谈、建立在封闭式问题上的调查研究),和“数据分析方法”(比如定性的内容分析、福柯式的话语分析、定量的内容分析、结构方程模型)。第二个原则是,研究者可以根据具体的研究问题、理论和目标选择不同的搭配来理解他们的数据(Bergman, 2008: 15)。有鉴于此,研究者是在处理客观现实还是建构起来的现实,又或者是在做假设检验还是探索性的分析,都与数据是通过统计调查或者其他什么方法收集的无关(Bergman, 2008: 16)。举例来讲,定量方法如果是作为“数据分析方法”,也可以用于定性访谈数据;如果是作为“数据收集方法”,所获得的数据也可以使用一些定性分析的方法,如探索性分析、个案分析。同理,也可推论定性方法。
当然,完全打通定量和定性方法之间的区隔不免有些极端,因为数据收集方法所传达的本体论和认识论观点会对数据分析方法有一定的要求。这也是为什么很多专家都提醒,在使用计算机辅助软件分析定性数据时,横剖式的编码要与变量分析的定量逻辑区分开来。如梅森(Mason, 2002)认为,要达到定性数据每一部分之间高度的一致性是不可能的,并且定性数据所反映的复杂的社会过程和机制也不应该被缩减到一个静止的或简单的变量,所以编码的形式和分析的方法可能会在不同数据上有变化。本研究也持类似的观点,因此在处理定性数据时使用了不同的分析逻辑,同时将横剖分析与语境分析(contextual analysis)、个案分析相结合(详见后文)。但是,将客观分析的方法应用于定性数据毫无疑问是可行的,而且已经在社会科学中得到应用,比如对于被访者的年龄、收入等人口特征的分析以及对于被访者的语言构成的分析,后者在本研究中尤其重要,下文将进一步解释。
总的来说,布莱曼和博格曼的观点非常富有启发性。他们不仅为混合研究方法提供了比较一致的辩护理由,也提高了混合研究设计的可能性。关于混合研究方法的争论也提醒了研究者,应当根据研究目的、数据类型甚至研究者的资质选择一种合适的策略来系统地联结数据以及合适的数据分析方法。
本研究采用混合的研究方法,从不同视角揭示和解释中产阶层的消费模式,目的是丰富和深化研究发现并增强结论的可靠性。定量分析可以使用具有代表性的样本来描述中产阶层的人口特征、生活机会和消费模式,并可以同非中产阶层作比较,定量数据的图表尤其可以非常直观地展现消费模式的特征及其与社会经济指标的联系。此外,回归分析可以对消费模式和消费倾向的影响因素做验证性的分析,增强结论的可靠性。本研究使用2003年、2008年和2011年的全国随机抽样调查数据作为定量数据来源(下文将详细介绍)。虽然是二手数据,但是这几套调查数据包含了有关人口特征和消费行为的一些变量,能够获得有关日常支出、耐用品拥有、消费偏好和生活方式等方面的研究发现,同时节省了数据收集的精力。
但是,定量分析的显著不足就是中产阶层的样本较小——虽然总体样本较大,但是中产阶层的样本比例不超过30%,很难获得中产阶层内部在消费模式上的差异。而且,定量分析也难以获得主观的解释以及消费行为如何被具体的文本所塑造等信息。这些任务只能由分析定性数据来完成。第二章提到,本研究借助伍德沃德(Woodward, 2003)的研究路径,考察中产阶级对于消费选择和行为的解释中暗含着怎样的辩护理由,由此建构出有关消费倾向的性质和程度的结论,因此定性分析必不可少。本研究收集定性数据的方法主要是半结构式访谈。访谈的方法有利于理解“真实的生活”,能够在具体的文本中获得丰富的和整体的数据,所以对于理解潜在的和内在的问题尤其有效(Miles and Huberman, 1994)。
事实上,在文化资本和消费文化研究领域,广泛应用的研究方法是调查数据的多元对应分析(multiple correspondence analysis,简称MCA)结合定性访谈数据的分析。这种方法自布尔迪厄(Bourdieu, 1984)开始受到拥护,在当代研究中仍然受到欢迎(比如Silva and Wright, 2008; Bennett et al., 2009)。在访谈数据之外,本研究也有丰富的定量数据来源,将使用多种数据分析方法,包括多元对应分析和回归分析等,下节将详细说明定量数据的分析方法。
总之,在本研究中,定量和定性的研究方法将发挥各自的优势,定量分析能够以较大的样本并通过与非中产阶层的对比产生丰富的、可靠的结论和一些分析的框架,而定性分析通过挖掘中产阶层内部的差异并联系社会文本和社会规范能够深化定量的研究发现,也能形成关于消费倾向和动机的比较深入的结论。这种研究策略类似布莱曼(Bryman, 2008)所谓的“强化”策略。
在大数据时代,大众在微博上的转发和传播行为以及讨论内容是重要数据,本研究也收集了微博数据分析网络购物行为。从数据形式上,微博数据既有数字和文字,甚至也有特定意义的符号;从分析方法上,既可以应用统计建模的分析方法,也可以应用文本分析方法。因此,将微博数据归为定量或者定性之下都不是特别合适,又或者可以说微博数据的分析方法很好地体现了定量和定性方法的混合。微博数据有独特的研究优势,特别是对于当代新出现的现象和事物,本书将在第十二章详细解释这种研究方法。下面两个部分将分别介绍这两种数据来源和各自的分析方法。
一 定量数据的来源
本研究的定量数据主要来自2003年中国综合社会调查(China General Social Survey,以下简称“CGSS2003”)、2008年和2011年的中国社会状况调查(以下简称“CSS2008”“CSS2011”)以及一个针对985高校毕业生的调查。
CGSS2003是由中国人民大学社会学系和香港科技大学社会科学部合作主持的全国城镇随机抽样调查。被调查人群为18~69岁居住在中国城镇住户中的成年人。该调查只包括城镇地区,使用五阶分层抽样和PPS(Probabilities Proportional to Size)整群抽样,共涉及125个县级单位、559个居委会、5900名被访者,收回有效数据5894条,应答率为77%。调查信息包括被访者和所在家庭(户)的人口特征、社会网络、教育程度、职业历史以及获得当前工作的过程、户口迁移、认同、消费行为以及有关社会不平等和其他公共关心话题的观点。
CSS2008和CSS2011由中国社会科学院社会学研究所主持,使用多阶随机抽样的方法,范围大致覆盖全国各省/自治区的城乡区域,抽样设计基本保证数据能够代表城镇地区(因为本书主要关注城镇居民),调查对象为18周岁及以上的中国公民。2011年A卷(本研究所使用的调查问卷)发放量为7552份,样本量为7036, 2008年的样本量为7139,所以该数据既有很好的城乡代表性,又有较大的样本量和较高的应答率。
另一个数据来源是中国社会科学院社会学研究所青少年与社会问题研究室进行的“2010年6所985高校毕业生抽样追踪调查”(以下简称“985高校调查”)。调查从东南、华南、西南、西北、东北和中部地区各选取1所985高校,基于各校历届毕业生名单进行随机抽样,然后通过E-mail联系被选中的调查对象,请调查对象登录网上调查系统填答问卷,当各校毕业生的回应率达到50%时停止调查。结果调查了这6所高校2003~2010年毕业生共4655人。
(一)数据分析方法
本研究的分析模式既有验证性的分析也有探索性的分析。验证性的分析允许研究者假设一种他们认为可以解释因变量的特定的模型或者因子结构,然后再验证或者确认模型和数据之间的拟合质量(Meyers et al., 2006)。同探索性分析比起来,验证性分析更多是一种演绎的方法,从而能够在庞大的数据中更加有效地建立起变量之间的关系。建立在相关理论和现有研究的基础上,本研究更多地采用验证性的分析——回归分析,主要包括二元逻辑回归、定序逻辑回归和多项逻辑回归。但是探索性的分析可以在没有研究者预设的情况下获得变量之间的关系、行为模式等信息,对于了解数据或者进一步的验证性分析打下坚实的基础,也可能会产生一些新的发现。本研究在城镇居民消费倾向和休闲消费的分析中采用了探索性的多元对应分析,然后对于休闲消费模式做了进一步的回归分析。
一项大型的关于英国的“文化资本和社会排斥”(cultural capital and social exclusion)的研究结合了调查数据的多元对应分析与座谈会和个案访谈的分析。秀娃等研究者(Silva et al., 2009)认为,多元对应分析的方法提供了一种描述社会的“关系性”(relationality)的途径——在调查数据的使用中没有预设任何有关“因变量”的分布;对于座谈会和定性访谈的分析可以进一步论述多元对应分析所揭示的区分和整合的形式,深化我们对于意义和行为的理解。
另外,采用多元对应分析也出于实际情况的考虑。在消费研究中,很多对于消费活动参与、消费态度、耐用品拥有的测量都为定类或者定序变量,因此对应分析是进行数据简化的常用方法,广泛应用于文化资本研究和市场研究(见Hoffman and Leeuw, 1992; Gayo-Cal et al., 2006; Bennett et al.,2009)。本研究的定量数据中有关消费行为参与的变量也为定类或者定序变量,作者尝试了两种普遍的数据简化方法——因子分析和主成分分析,然而这些定类和定序变量显著地呈偏态分布;因为因子分析和主成分分析都假设的是因子/成分变量的正态分布,所以本研究只能求助多元对应分析。对应分析可以看作主成分分析在定类数据上的应用,该方法考虑的是主成分分析的几何定义而非统计定义(Blasius and Greenacre, 2006: 12; Greenacre, 2006: 42)。因此,作为一种非线性多变量分析方法,多元对应分析没有主成分分析那样对变量有正态分布的假设,又可以形象地显示两个以上定类变量之间的关系(Greenacre, 2006: 41-42)。
除了对于非正态分布的容忍之外,多元对应分析还有另外两个优势使其在多元尺度分析方法中脱颖而出。首先,对于研究发现的图表展示非常容易解释。一方面,两个类别之间的距离使得研究者可以推断个体之间的相似度,比如在一张图中“30~45岁”和“女性”两个类别可能距离很近,就表明女性样本和年龄在“30~45岁”的样本的行为模式很类似。另一方面,每个类别对于每个轴的贡献指标可以让研究者进一步解释数据所揭示的模式。其次,在消费模式的图表做出来之后,可以加入补充变量进入图表中,将消费模式与人口特征变量联系起来,但不改变原有图的系数。以上两点在大多数可以进行多元对应分析的软件中都可以做到(个体案例的云图、主要类别的点图以及补充变量的点图)。连续变量只有被瓦解为定序或定类变量之后才能在多元对应分析的图中显示。“个体案例的云图”(the cloud of individuals)可以帮助估计哪些案例通常有类似的消费模式。如果是从调查数据中选取的访谈对象,云图还可以帮助标出被访者在多元对应分析图中的位置。法国软件SPAD是进行多元对应分析的最佳工具,但是本研究无法获得。受到分析软件(本研究使用STATA 12.0)和数据来源的限制,本研究无法做出个体案例的云图,也无法在多元对应分析图中标出被访者的位置,但这并不妨碍该方法其他优势的发挥。多元对应分析的具体应用和研究发现将在第九章讨论。
(二)数据评估
这些定量数据的显著优点在于样本较大,有全国代表性,因而研究发现在一定程度上可以推广。虽然CGSS2003只是城镇调查,但是本研究关心的也是城镇中产阶层及其消费模式,因此也没有问题。另外由于是综合性的调查,变量也较为丰富,既包括支出、消费行为等,也包括详细的地区、迁移等信息,从而能够研究日常消费、住房和休闲消费等多维度的消费模式以及都市本地人与外地人的差异。
不足之处就是中产阶层和都市人口的样本相对较小,无法详细分析其内部差异。另外,消费相关的变量集中在物质产品和服务的购买,而较少涉及使用和欣赏,这是目前很多调查数据共同的不足之处,可能因为物质产品的使用和欣赏乃至物质文化难以使用定量的方法测量,因此,仅依靠定量数据,难以获得深入和全面的分析。
但是这些定量数据来源仍然能够胜任本研究的分析任务,数据质量也较高,而且“985高校毕业生调查”和访谈数据可以在一定程度上弥补全国性调查数据的缺点,能够深入考察中产阶层在生活机会和消费模式上的差异。
二 定性数据的来源
收集定性数据的方法是半结构式访谈。作者于2008年在北京访谈了29位中产阶层成员,在2007年做过一个试探访谈(pilot interview)。访谈的内容包括购物习惯、物质产品的处置(disposition)、偏好、物质欲望、焦虑和困境、社会互动以及都市效应。定性数据的收集将会按照访谈设计、试探访谈、样本选择和田野调查的结构来介绍。然后,本部分将讨论访谈的转录和分析方法。最后,定性数据将会被客观地评估。
(一)访谈设计和研究伦理
定性分析旨在理解中产阶层消费模式的复杂性和中产阶层自己的解释。半结构式访谈可以让研究者主持谈话,并可能使那些研究者忽略了的或者嵌置在日常行为中不易察觉的问题浮出水面。半结构式访谈比结构式访谈和调查问卷更加灵活,比参与式观察节约时间。
基于研究的主题,访谈问题主要关注消费的三个方面,即日常消费、品味和物质文化。访谈问题的结构如下。
(1)与行为和社会习俗相联系的日常消费,包括购物频率、购物地点、支出类型和支出管理、家庭购物、家庭责任、赠送礼物、消费中的社会互动,以及代际差异。
(2)品味,也就是对于消费品和活动的偏好,关心的是品味在中产阶层中的分布,中产阶层如何在个人品味的基础上做出有关品味的判断,以及他们如何对自己的品味作出辩护。
(3)物质文化,主要指物质产品的处置、物质欲望的性质和程度、维持物质欲望和收入之间平衡的策略。
(4)消费行为的变化以及都市效应,关心的是消费行为在生命历程中的变化以及居住在北京对于消费行为产生的影响。
(5)焦虑和困境,关注的是消费中的焦虑、矛盾和压力,以及消费者的策略。
(6)最后,人口特征作为背景信息,包括职业、住房、家庭、迁移、年龄和收入(包括工资收入及其他投资、经营等收入)。
可以看到,在消费的三个主要维度之外,访谈问题还包括了消费行为的变化和焦虑。在人的生命周期中,购物习惯、支出、品味和物质欲望可能会发生变化,这些变化则反映了社会流动、个人取向以及社会变迁等,本研究尤其关注的是消费行为如何被居住在大都市的经验所塑造。关于焦虑和困境的问题则更加具有反思性。在试探访谈和最初的几个正式访谈中,我发现中产阶层往往表现得非常乐观、自信,所以后来加入了这些关于困境和焦虑的问题,让被访者有机会反思——回忆起消费中不那么令人愉快的方面或者一些矛盾情绪。另一个在田野调查中加入的问题是有关“信贷危机”的影响,因为自2008年开始中国也被全球经济危机波及。访谈设计中没有涉及消费如何作为履行公民责任的领域的问题,因为与本研究的主题不是特别相关,但是少数被访者提到了该话题,所以本研究也将就这些数据进行一些讨论。
在访谈结构拟定好之后,另一个挑战就是操作化。我必须在访谈中覆盖这些话题,同时又要使得谈话愉快地进行。我主要采取了两个办法。一个是从日常习惯谈起,再转入较为反思性的讨论,另一个办法是关注详细的故事而不是概括性的结论。第一个策略是为了让谈话由浅入深,被访者在这样的过程中不会感到很吃力。第二个策略的原因是我发现有的被访者喜欢表达一些空泛的观点和行为,比如“这个社会的奢侈消费太严重了”“我没有很强的物质欲望”“我不买很贵的东西”,或者以“例如一个手表”“例如一个人”这样的假设开头。这些数据具有一定的信息量,但是因为缺乏具体的文本而意义不大。这个实际上是在民族志(ethnography)研究中当遇到受过良好教育的被访者时常常会遇到的问题。哈默斯莉和阿特金森(Hammersley and Atkinson, 1995)谈到,这种高度抽象或者理论化的回答——通常由受过良好教育或者“久经世故的”被访者给出,从描述游离到了分析,有破坏数据的危险;被访者如此反应,主要原因是访谈中互动的结构使得参与者意识到访谈者作为观众的存在(因此会有树立某种形象或者自我保护的表现)(Hammersley and Atkinson, 1995)。所以,在访谈中我鼓励被访者告诉我每一个故事尽可能多的细节,不管这些细节多么琐碎和微小。这些努力使得我有足够的信息来思考研究发现并建构结论,从而增强了访谈数据的可靠性。
上述两个策略之外,我也特别将关于收入的问题保留到了访谈结尾,并且告诉被访者可以选择回答或者不回答。原因很简单:人们更可能在与研究者建立信任之后才会透露更多的私人信息。这个策略帮助我从90%的被访者那里获得了有关收入的数据。数据的质量将在下文进一步讨论。至于少数没有告诉我收入的被访者,他们的收入也可以通过消费品的拥有和支出来推断。
在做田野调查之前,我也思考了访谈中可能会涉及的伦理问题。最重要的是确保访谈数据的保密性和匿名性。经被访者同意,访谈会进行录音,但是这些文件将严格保密并且只有作者本人能够接触。我不会泄露任何信息给介绍人,也不会使用他们的真实姓名泄露个人的信息。所以,为了确保数据的匿名性,本研究中的被访者姓名均为化名。田野调查之前,本研究通过了曼彻斯特大学伦理委员会(the Ethics Committee of the University of Manchester)的审核并签订了文件,因此数据的保密和匿名在该委员会的监督之下,并且在访谈之前都向被访者作了解释。事实证明,数据收集时获得被访者的知情同意(informed consent)对于建立双方的信任关系非常有帮助。另一个伦理问题是个别的访谈问题可能会引起被访者的焦虑或者尴尬。但是,这在访谈之前也已向被访者说明,如果有任何问题让他们感到不舒服,他们有权拒绝回答或者停止讨论。例如,被访者可以选择告诉我收入或者保密,或者在回顾他们的物质欲望时遇到不愉快的回忆可以立即停止。针对后一种情况,我的策略是一般不直接询问这些问题,而是在合适的时机问及或者让被访者自己提到。
(二)试探访谈、样本选取和田野调查
为了测试访谈问题的有效性和可行性,作者于2007年夏天在北京做了一个试探访谈。访谈对象是一位在四大会计师事务所工作的咨询师,女性,27岁,在18岁上大学时迁移到北京。谈话进行得非常顺利,表明购物和消费是非常令人愉快的话题。事实是,被访者显著的乐观情绪让我决定在以后的访谈中补充有关焦虑和困惑的问题。试探访谈的时间也有点长,将近三个小时,也提醒我要减少问题的数量并控制谈话的节奏。这个访谈也被完全转录并且输入Nvivo中,和其他的访谈一起分析。
本研究于2008年1月开始进行正式的访谈。根据有关中产阶层的现有文献,访谈对象的选择建立在职业的基础上,主要包括管理性和专业性的职业,如私营企业主、经理人员、专业人士和公务员,同时考虑了职位的级别和雇主的规模。大多数被访者由我的朋友和熟人介绍而认识,但之前从未见过他们并且他们之间也互不相识。在样本选择过程中,我注意了两点:①避免我所熟知的人,比如我的朋友,因为他们具有的同质性和与我的亲密关系可能使得研究结果出现偏差;②希望选取的样本覆盖尽可能广泛的人口特征,比如年龄、性别、职业、所处行业、家乡/出生地、教育程度、收入等。这种样本选取策略旨在避免样本局限在某个特殊人群,并非追求概率抽样的普遍性或代表性,正因此,本研究对于定性分析的结论使用的是理论推广而非经验推广(详见后文)。
在25个访谈之后,我获得了非常丰富有用的信息来回答研究问题。为了获得更多有关消费模式的信息,我又继续做了4个访谈,重点关注品味的判断和辩护、都市效应以及应对消费中压力和焦虑的策略。因此,本研究的正式访谈有两个阶段,一共有29位被访者。
当获得一位候选人的联系信息时,本研究进行访谈的程序如下。我会给他/她打电话或者发邮件,说明访谈的目的以及保密和匿名的规则,如果被访者要求的话,我还会附上访谈的结构,然后跟被访者约方便的时间地点。结果是,大多数被访者选择在工作地点或者附近进行访谈,例如在他们自己的办公室、会议室或者附近的咖啡馆;只有两位女性邀请我去了家里,其中一位正在怀孕所以更愿意在家接受访谈。从中或许可以推断,工作场所是中产阶层组织其日常生活的一个非常重要的空间,尤其在处理不那么亲密的社会关系时。在10个于咖啡馆进行的访谈中,只有3份账单是我付的;这3位被访者与我同龄,其他比我年龄长的被访者都坚持他们付账单。因为被访者知道我当时还在读书,或许可以看出,性别、年龄、社会阶层在中产阶层的消费中发挥着重要的作用。换句话说,男性为女性、年长的为年幼的、富裕的人为收入较低的人付账这种传统的行为模式在当代中产阶层群体中仍在起作用。另一个可能的原因是这点支出对于被访者来说微不足道,只是人和人之间一种情感的传递罢了。
虽然在联系候选人之前,中间人已经将我介绍给了候选人,但还是有一定的拒访率。我的访谈要求一共被六位候选人拒绝。两位是40多岁的中层公务员;一位的答复是“我现在非常忙,稍后打电话给你”——但是后来音信全无,另一位的答复是“我完全不懂消费,说不出什么”。他们可能担心的是访谈的保密性或者收入可能会在消费中体现出来。虽然我一再保证数据的保密性和匿名性,但是无法说服他们。在这两位公务员之外,我的访谈邀请也被一位国有股份制银行支行的中层经理拒绝,她的答复是可以访谈,但必须有一群同事陪着接受访谈。由于本研究主要还是想通过深度访谈获得个人对于消费倾向的解释,方法论上较少地考虑了同辈群体或者熟人在场带来的压力,为了保证数据的可靠性,只好舍弃这个案例。
鉴于类似可理解的原因,本研究的访谈样本中没有太多来自国有或者政府机构的中产阶层,比如政府官员或者国有企业的中高层管理人员。一位IT行业的专业人士愿意被访谈,但是同时声明拒绝录音,最后我也不得不舍弃了。事实上,拒绝录音的案例在我从事此研究之前的田野调查中也曾发生过,可能暗示着中国人还未从“文化大革命”的恐怖记忆中恢复过来,那时一个无辜的人因为任意的一个纸片或者一段录音就可能锒铛入狱。但是,值得欣慰的是,在答应访谈的被访者中没有人拒绝录音。第三类不成功的联系是要求报酬。为了对其他被访者公平,并且类似的候选人也能够找到,该案例也被舍弃了。说实话,有一些拒访的理由可以理解,也值得研究者反思。除了以上提到的历史阴影之外,研究者的声誉也被一些负面的事件所破坏,比如泄露被访者的信息或者以社会研究的名义进行市场研究。这更需要社会学学者在做田野调查时恪守研究伦理,经验也证明,事先获得被访者的知情同意非常重要。
无论如何,本研究最终完成了30个访谈,包括1个试探访谈,表1-2列出了被访者的主要特征。不是所有的被访者给出了年龄和收入的数据,所以表中一些年龄和收入的数字是从已有信息中推断的。
表1-2 被访者的人口特征,北京,2008年
访谈数据中的“移民”指的是出生后从国内的某个地区迁移到北京的人群;“本地人”指的是在北京出生的人群。表中可以看出,被访者大都在27岁至60岁之间,11位为本地人,15位为男性,分散于诸多行业,单位性质既有国有部门也有非国有部门。图1-1更加直观地展现了以年龄和性别区分的被访者收入的分布。被访者的年龄大都处于26岁至30岁以及31岁至40岁,年收入集中于5万至20万元之间;收入的性别差异显著——更多的女性分布于金字塔底部,年收入为5万至20万元之间,而更多男性的年收入为20万元以上。就年收入低于20万元的被访者来说,他们大都为30岁以下或者50岁以上,职业为公务员、国有医院医生、高校教师或者学者,或者为年轻的企业职员。在收入的金字塔顶端,即年收入100万元及以上,被访者为两位私营企业主——分别从事金融投资和艺术品制作,以及两位高层管理人员——分别在大型跨国企业和上市媒体企业工作。
(三)分析方法
每次做完访谈之后,我都会迅速记一些笔记,记录访谈中我感兴趣的点滴,比如主要的回答、身体语言以及其他有关个性和取向的细节。在分析数据的时候,这些笔记十分有用。它们将我迅速带回了当时的场景,并且用高度简洁的语言勾勒了每个访谈的要点。因此,这些笔记是“初步观点”(plausibility)的重要来源(Miles and Huberman, 1994: 246-247),可能会迅速带来一些结论性的观点,当然在之后的分析中需要进一步系统化。这些直觉性的观点对于之后的编码、关联数据以及解释数据带来了很大的便利。
图1-1 被访者以年龄和性别区分的收入分布
在前4个访谈(包括1个试探访谈)之后,我将录音完全转录并且输入Nvivo7.0。这三个访谈的文本让我得以评估访谈问题以及访谈的进行。至于其余的26个访谈,我采用了一种“革命性”的转录方法。我将每一个录音文件标上时间轴,然后对每一小段录音(约每隔30秒)进行摘要记录,接着将每个录音的“摘要”文本输入Nvivo。这种方法节省了大量的时间和精力,省略了一些不重要的细节,同时这些时间轴和摘要也允许研究者像对待完整的转录文件那样编码和分析。分析的细节将在后文详述。有了时间轴作为导航,我可以很容易地从大量的录音文件中找到所需要的信息,如果有需要的话,也可以完整转录某些片段。但是,这种方法也会有忽略相关材料的风险。Hammersley and Atkinson(1995: 149)提到过这种转录的方法,在赞其“革命性”的同时也提到了风险:“尤其是哪些材料比较重要可能在不同分析阶段会有变化”。我的对策是在分析的第一、二阶段(即编码和关联阶段,下文将详述)尽可能多地转录,当需要调整一些分析的时候,再回到录音本身。其实在操作中,这种方法并不像叙述的这样复杂,并且边听录音边思考比读电脑中的文本文件要愉悦得多。转录之后,余下的分析基本上经过了四个阶段:编码、关联编码、建构结论/观点以及验证结论。
分析的第一个阶段为数据的编码和检索,也是通过Nvivo来辅助。编码是根据研究的主题来确定的,包括日常消费、品味、物质文化、都市效应和焦虑。但是,这一阶段的编码比较杂乱,我希望通过编码的方式尽量探索和熟悉数据。大多数的编码为横剖类型,基本上属于“文本的”(literal)和“解释的”(interpretive)编码(Mason, 2002: 149)。“文本的”编码包括被访者所使用的语言和词汇,互动的顺序、对话的形式和结构以及文本内容(Mason, 2002: 149)。就本研究而言,比如,“偏好”、部分的“辩护”、“困惑和焦虑”“都市效应”以及所有的人口特征编码都属于“文本的”编码。“解释的”索引强调研究者给予的解释,好像研究者在问自己“你认为数据说明或者代表什么,或者你认为可以从数据中推断出什么”(Mason, 2002: 149)。这种类型的编码是最多的,而且从研究者的角度来讲,在获得文本编码信息的同时也都会思考“这说明了什么”。解释的编码例如,“平衡物质欲望和购买力的策略”“社会价值”“品味的理解”以及部分的“辩护”、部分的“物质欲望”、部分的“与父母的比较”。我也考虑了研究者在访谈中的角色作用,比如,如果不是我访谈的话被访者是否会提到别的消费偏好,或者被访者在解释自己的行为的时候是否想要树立某种形象?第一阶段结束时,总共建立了61个自由编码(free nodes)。
然后继续分析这些编码之间的关系。每一个自由编码都被归类到一个相关的主题中,结果,总共建立了15个、每个有三个层次的树编码(tree codes——具有从属编码的编码)体系。事实上,一些自由编码不止被归类到了一个树编码中,还有一些转录/摘要文本不止被归类到一个自由编码中。这正是定性分析的独特之处——自由编码和树编码的内容之间并不一定要互斥。在归类和关联自由编码的过程中,主要应用的是解释性的逻辑,例如,将品味的“辩护”与“年龄”、“收入”关联,将“社会互动”“家庭义务”“父母和子女的区别”和“家庭购物的性别角色”归入了“社会习俗”的树编码中。
一方面,文本分析可以得到有关消费模式和社会文本的信息;另一方面,解释性的和反身性的逻辑——在建构观点的时候将客观观察与社会文本相联系并考虑“观众”的角色作用,可以增强文本分析的理论意义、克服文本分析中研究发现取决于数据是否真实的局限性。在索引和关联数据的过程中,一些编码的内容和定义也经历了多次调整,在Nvivo的辅助下操作起来非常方便。同时,大量的“评注”(annotation)也保存在了软件中,包含了一些重要录音片段的转录以及我在分析中的笔记。在编码和解释的不同逻辑之外,我也将横剖分析与语境分析(contextual)和案例研究相结合,这也是为了避免计算机辅助的定性分析的“定量陷阱”,在本书中消费的代际差异、品味和物质欲望等的分析中都会有所体现。本研究就是在这些分析方法的基础上建构结论的。
本研究期望得到的结论和观点,如果按照马森的分类(Mason, 2002),就是有关事情如何发展、如何发生作用或者如何组成的。本研究将讨论中产阶层消费行为的特征以及消费模式的历史发展,试图通过消费倾向来解释消费模式,并详细说明新的消费倾向如何受到社会习俗和社会文本的调节。有关定性分析的章节将会说明结论如何从数据中得到以及相关的解释如何被建构。
为了验证结论的有效性,我首先寻找数据中的“异类”,来检查结论是否对所有数据适用。比如,结论之一是强调对乐趣的追求在中产阶层尤其年轻中产阶层中非常明显;然而,“万女士”是一个在年轻一代中相对节省的案例,“何女士”是一个强调舒适和产品质量的案例。通过将这两个案例同其他案例相比较,我发现万女士比其他同龄被访者的收入低些,何女士比追求乐趣的被访者年龄较大并且负责家庭中的购物。这个分析强调了年龄、收入以及性别在塑造消费倾向上发挥的作用。因此,“异类”案例也能够被结论所解释,并且对于“异类”的分析进一步强化了结论。
另外一个验证结论的策略是从我的朋友们——同为中国消费文化的中产阶层参与者——那里获得反馈。一开始,他们的讨论集中在对于忙碌和“无聊”生活的抱怨以及由于可支配收入太低而挣扎。这样的反馈最初让我感到很沮丧,也让我开始怀疑所谓对于乐趣的追求是否真正地在中产阶层中“显著”。但是,我很快意识到这正是我的研究结论的证据。只有当中产阶层期望那些带来乐趣和舒适的物质产品的时候,他们才会感受到过低的购买力带来的紧张。也正是因为日常生活在他们看来是有压力的和重复性的,他们才更加热衷于追求乐趣并伴随着对舒适的追求,但并不特别关心显示自己地位的维度。这也是为什么当我继续询问我的朋友们如何组织日常生活的时候,跟我的访谈对象十分类似,他们也将旅游(包括观光、徒步、探险和野营等)作为假期的首选。
本研究结论的推广主要是理论推广,这种推广被认为在定性分析中比经验推广更为有效(Mason, 2002; Hammersley and Atkinson, 1995)。首先,本研究的样本选择策略清楚地显示,被访者是从非常广泛的中产阶层群体中选择而来,所以没有理由怀疑数据可能有较大偏差。其次,结论指明了这种消费倾向在中国实践的不同方式以及社会文本。方法论和结论的验证也表明,结论也可以被用来解释其他社会情境(settings)中的消费模式。当然,研究结论在其他情境中的理论推广是否合适,受到那种情境与本研究所定义的情境的相似程度的限制。本研究情境的具体细节将会在定性分析章节中进一步解释。
(四)数据评估
由于被访者的善意合作,数据的质量得到很好的保证。他们不仅对于数据收集非常耐心,而且大多数人非常慷慨地、倾尽所“知”地帮助我。一个原因是他们觉得购物和消费的话题比较让人愉悦,前面也提到过。另一个原因,据几位被访者提到,他们认为我的研究能够为这个社会带来一些有益的启示因此非常高兴能为此做出贡献。另外,整体上,住在北京的人向来有直爽和开朗的口碑,相比而言住在上海的人更加谨慎。这也是为什么访谈对象和研究者之间的信任比较容易建立。
无论如何,被访者的回答仍然需要更多的社会学思考。比如,有关昂贵的礼物通常只赠送给亲密的社会关系的回答,需要研究者思考这样一个话语的文本:被访者处于什么样的社会地位?在什么样的话题中提到这种倾向?想要表达什么?另一个例子是有的被访者提到使用带有超大商标的奢侈品是一种不好的品味,但是研究者需要思考在多大程度上这些被访者在实际生活中拒绝这种炫耀性消费。
通过田野调查,我认为可能影响被访者回答的主要是四个因素。一个是“形象管理”,人们有意识或者无意识地努力树立某种形象,而且被访者的这种反应连同前文提到过的善于理论总结的“久经世故”的被访者是在民族志中经常遇到的情况(Hammersley and Atkinson, 1995)。第三个因素是来自于对我的印象,当谈话对象是一位在英国读书的20来岁的女性博士生时,可能会鼓励被访者积极谈论时尚、购物和奢侈品等话题,并避免提到可能使他们感到难堪或者看起来悲惨的事情。这是研究者作为“观众”的效应,因此数据必须经过反身性的分析。第四个因素是自我保护:为了保护个人的隐私,避免泄露比较私密的信息。这种情况下,研究者可能获得有关收入、品味或者家庭背景的错误信息。以上这些问题在田野调查过程中我已经意识到,因此采取了各种各样的策略来提高数据的“真实性”。在与被访者谈话时,我尽量保持“职业化”——向他们保证数据使用过程中的保密性和匿名性,并且表现出对于各种情感和体验的理解。