Datawhale2025年3月组队学习-办公小能手-task1

112 阅读8分钟

文本大模型与提示词

教程笔记

  • 除了按照教程进行,我还尝试了修改提示词,以下是我使用的提示词:

我在班级群里问了这样一个问题

大家好呀,咱们现在统计一下这学期春游团建需要买的小吃,大家根据接龙回复数字就行!每个人最多回复三个选项,投的多的优先购买哦!尽快投票~

可选零食清单

1 炸鸡汉堡

2 旺旺零食大礼包

3 星球杯大桶

4 虾条薯片

5 盐焗鸡腿

6 徐福记小零食

7 蛋卷面包

8 康师傅牛肉面

9 其他(可补充)

我最终得到的接龙结果是

接龙

  1. 张三 2 7

  2. 李四 2 4 6

  3. 王五 3 5 8

  4. 赵六 1 2 3

  5. 钱七 4 6 8

  6. 孙八 1 2 7

  7. 周九 2

  8. 吴十 248

  9. 郑十一 134

  10. 王十二 1 6 7

  11. 李十三 2 5 8

  12. 刘十四 1 2 6

  13. 陈十五 2 4 7

  14. 杨十六 1 5

  15. 黄十七 1 3 7

  16. 张十八 2 7

  17. 李十九 2 4

  18. 王二十 235

  19. 赵二十一 1 5 8

  20. 钱二十二 235

  21. 孙二十三 237

  22. 李二十四 237

  23. 周二十五 124

  24. 吴二十六 237

  25. 王二十七 1

  26. 赵二十八 3 4 8

  27. 钱二十九 2 3 6

  28. 孙三十 2 4 7

  29. 李三十一 2 6 7

  30. 王三十二 2 4 7

  31. 赵三十三 2 4 8

  32. 钱三十四 247

  33. 孙三十五 148

  34. 李三十六 2 6 7

  35. 王三十七 2 4 7

  36. 赵三十八 1 2 7

  37. 钱三十九 4 8

  38. 孙四十 458

  39. 李四十一 1 3 6

  40. 王四十二 348

  41. 赵四十三 1 2 3

  42. 钱四十四 235

  43. 孙四十五 236

  44. 李四十六 1 3 7

现在我想要统计大家的 投票 结果,帮我把接龙结果整理为一个excel表格,然后用进行 数据分析 和对应的可视化

  • 我得到的反馈:

好的,我可以帮你整理和分析这些数据。以下是详细的步骤和结果:


1. 数据整理为Excel表格

首先,我会将接龙结果整理为一个表格,方便后续分析。以下是Excel表格的结构:


2. 数据分析

(1)统计每个零食的得票数

我会统计每个零食的得票数,以确定哪些零食最受欢迎。以下是统计结果:

(2)分析结果

根据得票数,我们可以得出以下结论:

  • 最受欢迎的零食:旺旺零食大礼包(35票)
  • 其他受欢迎的零食:虾条薯片(22票)、蛋卷面包(20票)、星球杯大桶(18票)
  • 得票较少的零食:盐焗鸡腿(12票)、康师傅牛肉面(14票)、炸鸡汉堡(15票)、徐福记小零食(16票)

3. 数据可视化

为了更直观地展示结果,我会建议使用以下两种可视化方式:

(1)柱状图

绘制一个柱状图,展示每个零食的得票数。横轴为零食名称,纵轴为得票数。

(2)饼图

绘制一个饼图,展示每个零食得票数占总票数的比例。这样可以更直观地看出哪些零食最受欢迎。


4. Excel操作步骤

(1)创建表格

在Excel中创建一个表格,将接龙结果整理为上述结构。

(2)统计得票数

使用Excel的“数据透视表”功能,或者通过公式(如COUNTIF)统计每个零食的得票数。

(3)绘制图表
  • 选择得票数数据。
  • 插入柱状图和饼图。
  • 根据需要调整图表样式和标题。

如果你需要,我可以帮你生成一个Excel模板的描述,或者你可以直接在Excel中按照上述步骤操作。

  • 我要求给出模板描述,得到的回复:

好的!以下是生成Excel模板的详细描述,包括表格结构、公式和图表的设置步骤。你可以根据这个描述在Excel中创建和分析数据。


Excel模板描述

1. 创建数据表

在Excel中,创建一个工作表,命名为“投票结果”。按照以下结构输入数据:

注意:

  • 列C(投票选项数字)中,每个选项用逗号分隔。
  • 列D(投票选项零食名称)是可选的,用于方便查看,但不影响后续分析。

2. 创建 投票 统计表

在同一个工作表中,从第48行开始(假设数据有46行),创建一个新的表格,用于统计每个零食的得票数:


3. 使用公式统计得票数

在列C中,使用以下公式统计每个零食的得票数。以第49行为例,公式如下:

=COUNTIF($C$2:$C$47, "*" & A49 & "*")

公式解释:

  • $C$2:$C$47 是投票选项(数字)所在的范围。
  • "*" & A49 & "*" 是查找条件,表示查找包含序号1的单元格。
  • 将此公式向下拖动至第56行,即可统计所有零食的得票数。

4. 创建数据透视表(可选)

如果你希望更灵活地分析数据,可以创建一个数据透视表:

  1. 选中投票结果表(A1:D47)。
  2. 在菜单栏中选择“插入”->“数据透视表”。
  3. 将“投票选项(数字)”拖入“行”区域。
  4. 将“投票选项(数字)”拖入“值”区域,并选择“计数”。
  5. 根据需要调整数据透视表的布局。

5. 绘制柱状图
  1. 选中投票统计表(A48:C56)。
  2. 在菜单栏中选择“插入”->“柱状图”。
  3. 选择一个合适的柱状图样式。
  4. 调整图表标题为“零食得票数统计”。
  5. 设置横轴标题为“零食名称”,纵轴标题为“得票数”。

6. 绘制饼图
  1. 选中投票统计表(A48:C56)。
  2. 在菜单栏中选择“插入”->“饼图”。
  3. 选择一个合适的饼图样式。
  4. 调整图表标题为“零食得票比例”。
  5. 添加数据标签,显示每个零食的得票数和百分比。

最终效果

  1. 数据表:记录每个同学的投票选项。
  2. 投票 统计表:显示每个零食的得票数。
  3. 柱状图:直观展示每个零食的得票数。
  4. 饼图:展示每个零食得票数占总票数的比例。

希望这个模板描述对你有帮助!如果你在操作过程中遇到问题,可以随时问我。

  • 我按照回复进行操作的结果

整体没有问题,尤其是对于不太会使用excel的人群来说很友好,给出了正确的操作步骤,方便快捷。

Task 1

Q1:提示词除了三要素“角色”、“背景”、“要求”之外,还有哪些关键要素

对于一些特定的问题,还可以提供一些案例,用 one-shot 或者 few-shot 的形式帮助模型输出更好的答案。对于一些太复杂的问题,可以尝试将任务进行分解,一步一步让模型生成。

Q2:你知道什么是大模型幻觉吗,如果文本大模型有出现幻觉的可能,应该如何规避幻觉问题,可以结合你自己的实际经历展开聊聊

在论文《Survey of Hallucination in Natural Language Generation》中,大模型幻觉被分为两种类型,事实性幻觉和忠实性幻觉。事实性幻觉涉及大模型生成的与现实世界事实不一致或潜在误导的输出,再细分可以分为与事实不符合编造事实两种类型,忠实性幻觉强调大模型输出与用户指令的一致性问题,包括指令不一致、上下文不一致和逻辑不一致。规避或者减轻大模型幻觉的方法有很多,我了解到的有基于人类反馈的强化学习(RLHF),检索增强生成(RAG),还有提示词工程等等。

Q3:你是一名书法爱好者,写钢笔,现在创作一幅作品,送给朋友,作品纸有长(14)*宽(8)个格子,于是你希望用文本大模型找一首16行的七言古代诗歌(一行7个字),内容积极向上、充满乐观。尝试一下,完成这项任务。注:书法创作一般不写标点符号,一般从右往左写

使用deepseek,提示词如下:

我现在想创作一幅作品,送给朋友,作品纸有长(14)*宽(8)个格子,请你找一首16行的七言古代诗歌(一行7个字),内容积极乐观,从右往左,从上到下排版,不写标点符号

刘禹锡的《秋词二首·其一》

笑 愿 霞 莫 满 闲 千 万 岂 试 数 山 便 晴 我 自  
对 君 光 道 目 来 山 里 如 上 树 明 引 空 言 古  
人 长 依 桑 风 无 万 晴 春 高 深 水 诗 一 秋 逢  
生 似 旧 榆 光 事 水 空 色 楼 红 净 情 鹤 日 秋  
百 秋 照 晚 入 登 尽 一 嗾 清 出 夜 到 排 胜 悲  
事 阳 人 景 眼 高 悠 色 人 入 浅 来 碧 云 春 寂  
辉 暖 归 悲 眸 处 悠 秋 狂 骨 黄 霜 霄 上 朝 寥