#AI 提示工程的新境界: 解析思维图方法

文章讨论了提示工程中的 "思维图" (Graph of Thought) 概念, 使用图论来构建和指导 AI 的推理过程, 以解决提示工程中面对复杂问题和动态推理时的问题。

思维图概念框架:
- 使用图论建模思维过程, 节点代表概念或想法, 边代表关系
- 允许 AI 同时评估多个概念及其关系, 而不是遵循单一线性路径
- 更接近人类认知过程, 可以同时考虑多个想法及其相互联系

思维图框架的组成部分:
- 输入: 图结构, 捕捉复杂依赖关系和上下文信息
- 嵌入: 将图的节点和边转换为连续向量表示
- 交叉注意力: 允许模型在处理特定节点时关注图的相关部分
- 门控融合层: 结合嵌入和交叉注意力信息
- Transformer 解码器: 处理经过细化的图表示, 生成输出

思维图方法的优势:
- 增强推理能力, 产生逻辑一致的回应
- 更有效地解决复杂、多步骤问题
- 改善上下文理解, 在长时间交互中保持连贯性

原文链接:
https://analyticsvidhya.com/blog/2024/09/graph-of-thought/
#编程 Pandas中文网、Pandas官方中文文档:
https://pypandas.cn

YouTube视频教程:
https://youtube.com/watch?v=ZyhVh-qRZPA&list=PL-osiE80TeTsWmV9i9c58mdDCSskIFdDS

kaggle的Pandas微课程:提供了一系列免费的实践练习,非常适合边学边做。
https://kaggle.com/learn/pandas

W3Schools的Pandas教程:教程简洁明了,适合快速入门。
https://w3schools.com/python/pandas/default.asp

GeeksforGeeks的Pandas教程:这里有大量的实例和练习题,适合深入学习。
https://geeksforgeeks.org/pandas-tutorial/
#工具 Data Formulator 是由微软研究开发的 AI 助手,能够帮助用户轻松创建丰富的数据可视化。通过迭代方式,用户可以利用 AI 技术快速生成和优化图表,无需复杂的编程知识。立即在 GitHub Codespaces 中尝试 Data Formulator!
https://github.com/microsoft/data-formulator GitHub - microsoft/data-formulator: 🪄 Create rich visualizations with AI
http://zeli.app/zh 应该是我这一年来做过的十几个产品中,唯一一个我会想每天打开看看的那个,但我痴迷它的原因跟产品无关,是想看Hacker News的高质量内容。所以也许:当你有一个好玩的点子时,想想怎么借力,让它的好玩程度提升10倍。 #工具
#工具 来自 Graphlit 的文章比较了不同 PDF 数据提取服务, 将 PDF 转换为 Markdown 格式。测试使用了一个包含财务报表的样本 PDF 表格, 比较范围包括 LlamaParse、http://Unstructured.IO、Reducto、Zerox、Chunkr 和 Graphlit。

备注: 文章的评测数据只基于特殊选定的某个文件, 测试数据不具有全面性, 不过可以从某个角度体现多模态大模型的视觉解析和理解能力的结合。

Graphlit 使用 LLM 模式 (Claude Sonnet 3.5) 被评测为最准确的方法, 它能够实现:
- 正确提取表格结构和数据
- 保留原始格式和标题
- 捕捉细节, 如页面底部的页码

详细评测结果

Graphlit (Claude Sonnet 3.5) 整体表现最佳
- 准确提取表格结构和数据
- 完整保留原始格式和标题
- 捕捉细节 (如页面底部页码)
- 被评为处理复杂文档时最准确的方法

LlamaParse Premium 表现良好,但存在小问题
- 未能将第一行正确识别为标题
- 整体效果接近 Graphlit, 但在某些细节处理上略有不足

Unstructured.IO 存在明显问题
- 无法可靠地分离文本和表格
- 在处理复杂格式文档时面临挑战

Reducto, Zerox, Chunkr
- 总体表现可能不如 Graphlit 和 LlamaParse
Back to Top