AIGC辅助数据分析与挖掘:基于ChatGPT的方法与实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

Preface
前言

为何写作本书

在数字化时代,数据已经成为企业和组织的宝贵资源。数据分析与挖掘则是数据价值挖掘的重要途径,对于制定战略决策、优化业务流程和发现市场趋势具有巨大的作用。数据分析与挖掘不仅仅需要技术,还需要正确的理论、工具和方法,方能完成数据的收集、清洗、处理、分析、挖掘和展示等工作。这些工作并不简单,通常需要花费大量的时间和精力来学习与实践,甚至可能需要其他专业人士的协助和指导。

那么,有没有一种方法,可以让数据工作者更轻松、更高效地完成这些工作呢?答案是肯定的。这就是本书要介绍的AIGC(Artificial Intelligence Generated Content,人工智能生成内容)技术。AIGC是一种基于人工智能的引导式计算技术,它通过自然语言交互的方式,帮助用户完成各种计算任务,包括数据分析与挖掘、编程开发、文本生成等。AIGC技术是数据分析与挖掘的革命性引擎,为我们提供了新的机会和工作方式。

我编写本书的初衷是想分享我在使用AIGC技术过程中的心得和经验,以及我在数据领域的一些观察和思考。我认为AIGC技术是一种具有革命性潜力的技术,它可以让数据工作变得更加简单、快捷和有趣,同时让数据工作者更专注于数据的本质和价值,而不受烦琐的细节的困扰。我希望通过这本书,能够让更多的数据工作者了解和运用AIGC,帮助他们提升自己的数据分析与挖掘能力。

本书主要特点

❑ 使用流行且免费的AI工具:本书充分利用免费AI工具(如ChatGPT、New Bing Chat及第三方插件)进行数据处理,突出这些工具的强大能力、易用性等特点。

❑ 聚焦数据分析与挖掘领域:本书聚焦于数据分析与挖掘领域,与数据工作流程紧密结合,强调数据领域中核心工具(如Excel、SQL和Python)的应用。

❑ 详尽介绍多元化AI交互方法:本书全面介绍了多种与AI交互的方法,涵盖提示词指令体系及与不同工具的结合应用、AI交互反馈、多模态信息交互、个性化参数设定和提示词构建工具等内容,保证了AIGC知识的完整性和实用性。

❑ 以案例为核心:本书以案例为核心,通过案例展示如何与AI交互并解决实际工作中的问题,真实呈现实际工作场景。

❑ 强调人在AI应用中的主导地位:本书突出了人在AI应用中的主导作用,强调了在交互过程中如何充分利用人类的智慧、经验和能力达到预期的输出结果,进一步突出了数据工作者的工作价值。

❑ 提供丰富的辅助学习资源:本书提供了丰富的辅助学习资源,包括数据、图表、代码、提示语等,同时强调互动性,鼓励读者积极分享。

本书阅读对象

本书适合数据领域的从业者和爱好者阅读,无论刚入门的新手,还是经验丰富的专家,都可以从本书中获取有价值的信息和灵感。你不需要拥有深厚的编程或数学背景,只需对数据分析和挖掘感兴趣,并愿意尝试新的技术和方法,就能轻松阅读本书。

以下是本书特别适合的读者群体。

❑ 数据分析师:渴望提升数据分析技能和效率的专业人士。

❑ 业务分析师:需要更好地理解和利用数据来支持业务决策的专业人士。

❑ 市场研究人员:寻求更深入的市场洞察和趋势分析的专业人士。

❑ 数据科学家:对AIGC技术在机器学习和自然语言处理领域的应用感兴趣的专业人士。

如何阅读本书

本书共8章,分为四部分,根据不同的方法和数据工具(Excel、SQL、Python)进行组织。每个部分包含2章,除第一部分外,其余三个部分分别从方法和实践两个方面进行阐述。

❑ 第一部分(第1章和第2章)介绍了AIGC技术的基础知识,包括概念、产品、操作、指南、注意事项以及在数据分析场景中撰写Prompt的方法。这部分为后续章节提供了必要的AIGC工具和提示词指令的知识储备及技术指南。

❑ 第二部分(第3章和第4章)阐述了AIGC技术如何辅助Excel进行数据分析与挖掘,包括数据管理、处理、分析和展现等,以及3个实际数据问题的解决方案。

❑ 第三部分(第5章和第6章)探讨了AIGC技术如何辅助SQL进行数据分析与挖掘,包括数据准备、查询、清洗、转换、分析等,以及3个实际数据问题的解决方案。

❑ 第四部分(第7章和第8章)介绍了AIGC技术如何辅助Python进行数据分析与挖掘,包括环境构建、数据探索、数据处理、AutoML等,以及3个实际数据问题的解决方案。

你可以根据自己的需求和兴趣,选择相应的部分进行阅读。如果你想了解AIGC技术的基础知识和原理,可以先阅读第一部分;如果你希望学习AIGC技术在某个具体数据工具上的应用方法,可以直接跳到相关部分;如果你想查看AIGC技术在实际数据问题上的解决方案,可以参考每个部分的实践案例内容。

同时,为了更好地与AI进行交互,本书中的AIGC交互指令都按照统一规范编写。以下是一个完整的AIGC交互示例:

上述交互指令的具体说明如下:

❑ [ChatGPT]表示我们所使用的AI产品,默认为ChatGPT免费版和New Bing Chat(Bing Copilot)。

❑ 3/1/2中的3表示该对话是第几章的对话,该示例中是第3章。

❑ 3/1/2中的1表示该对话是本章的第几个对话,该示例中是第3章的第1个对话。

❑ 3/1/2中的2表示在当前对话中这是第几次交互,该示例中是第3章第1个对话中的第2次交互。

❑ “用户输入的Prompt指令”是输入的具体提示指令,该指令可能是一句话、一段话,甚至几个段落。

通过这样的交互规范,我们能够更清晰地呈现AIGC与用户之间的对话,包括所使用的产品、上下文信息、内容输入和输出等。同时,我们保持所有对话都使用系统默认参数,以确保读者在使用本书的Prompt示例时,能够更容易地还原案例中的细节。

勘误

尽管我努力确保本书的准确性和质量,但鉴于时间和能力有限,以及ChatGPT特性和功能快速迭代,书中难免会有错误和不完善之处。你在阅读过程中发现任何错漏或有任何疑问,欢迎随时联系我,我将不遗余力地进行修正和解答。你可以通过以下方式获取支持和更新信息。

❑ 关于本书的勘误、常见问题以及配套资源,你可以在链接https://www.dataivy.cn/article/2022/1/25/3.html中找到。

❑ 你也可以发送邮件至517699029@qq.com。

❑ 搜索“tonysong2013”添加微信,可以更直接地与我联系。

致谢

在本书的创作过程中,我获得了许多人的帮助、支持与鼓励。

感谢王晓东先生和柳辉先生,他们在触脉公司为我提供了很多发挥优势的机会,使我能够接触到不断涌现的新场景、新技术、新方法和新思维,开始认真研究、学习、探索和实践ChatGPT。此外,还要感谢与我密切合作的触脉团队成员,包括张默宇、张璐、白迪、王奇、许曼、丘岳才、杨思琦、洪晓丹、杨晓岳、胡振、张国锋等。在与他们一起工作的过程中,我积累了丰富的实践经验,由衷感谢他们的支持。

感谢一直支持我的读者朋友们。自2014年以来,有许多读者朋友与我以书会友,无论在内容、主题方面还是书稿质量等方面,他们都提供了宝贵的建议。正是因为有了他们的支持,我才有了写作的动力。

感谢我的家人,特别是我的夫人姜丽。在本书的创作过程中,她给予我无限的支持和理解,让我能够坚持不懈地写作。

最后,感谢你选择本书,希望本书能够为你的数据工作带来新的灵感和帮助。祝你阅读愉快!