#工具 来自 Graphlit 的文章比较了不同 PDF 数据提取服务, 将 PDF 转换为 Markdown 格式。测试使用了一个包含财务报表的样本 PDF 表格, 比较范围包括 LlamaParse、http://Unstructured.IO、Reducto、Zerox、Chunkr 和 Graphlit。

备注: 文章的评测数据只基于特殊选定的某个文件, 测试数据不具有全面性, 不过可以从某个角度体现多模态大模型的视觉解析和理解能力的结合。

Graphlit 使用 LLM 模式 (Claude Sonnet 3.5) 被评测为最准确的方法, 它能够实现:
- 正确提取表格结构和数据
- 保留原始格式和标题
- 捕捉细节, 如页面底部的页码

详细评测结果

Graphlit (Claude Sonnet 3.5) 整体表现最佳
- 准确提取表格结构和数据
- 完整保留原始格式和标题
- 捕捉细节 (如页面底部页码)
- 被评为处理复杂文档时最准确的方法

LlamaParse Premium 表现良好,但存在小问题
- 未能将第一行正确识别为标题
- 整体效果接近 Graphlit, 但在某些细节处理上略有不足

Unstructured.IO 存在明显问题
- 无法可靠地分离文本和表格
- 在处理复杂格式文档时面临挑战

Reducto, Zerox, Chunkr
- 总体表现可能不如 Graphlit 和 LlamaParse
如何在短期内提高表达能力
1.肚子里要有货。每天读些文章,杂志,新闻,多去查阅与自身环境相关的,然后思考,通过自己的话进行总结
2.培养创造性的思维,打破思维局限性,每天设置一个问题讨论,比如男女感情,问为什么女生讨厌男生说多喝热水?回答不仅仅局限一个方面,更是要多方位解析。
3.培养自信,自信能让你在不擅长或是害怕的领域对答如流,毫不怯场。最关键的就是坦然面对你最害怕的问题,并解决它。自信起来精气神会高很多,也很少有问题会让你想逃避。
4.培养接受错误的能力,不要害怕犯错,可以去选择你感到棘手的科研问题,或者之前不敢提的意见说明,坚持下去,你就会觉得原来感到畏惧的话题不过如此。
5.学会用眼神.肢体语言。适当表达你的情绪和关心,"懂你的人自然懂。
6.培养专注力。与人聊天时直视对方眼睛,对话话语中快速提取重点,然后针对重点在大脑里组织回答。
7.培养适合的说话节奏,如果你语速很快,有时候大脑跟不上,可以适当降低语速。而语速过慢,则尝试适当加快语速。
8.多和朋友交流,开始就像朋友普通聊天那样,慢慢提高难度,可以让朋友提一些奇异角度的问题,锻炼自己随机应变的能力。9.训练自己的逻辑思维。有条理,有层次,尽量抓住重点,简单明了的表达。
10.没想法的时候不说,有想法的时候慢说,没决定的时候少说,有决定的时候短说。
11.很有效的方法就是跟着新闻读。一是因为新闻语言表达标准到位,没有混乱的网络用语;二是因为新闻一般都是三五句话讲完一件事,逻辑清晰,不拖沓啰嗦,对于训练表达过程中的语言逻辑能力有很大的帮助。
12.少说话。是指少说废话,把话说在关键之处,让对方感受到你的心意。日常生活里要嘴比脑袋慢,比较重要的话先打个腹稿再说,说完的话常常复盘,看看自己怎么表达效果能更好。多多练习肯定能改进。
13.推荐反复观看辩论赛,对提高逻辑和语言组织表达能力非常有用。
14.锻炼逻辑思维和结构化表达,自多观察别人的说话技巧和方式,然后抓住机会表达和练习。
15.无关紧要时,不想说就别逼自己说。一定要说时,想清楚你的观点,你想做什么,说话对象是谁,场合是否适宜说。
16.尽量慢点说,不要着急,把要说的事情分清主次,开始的时候尽量只是阐述事实,少加入个人观点,慢慢好了再加入观点,同时也多听听别人怎么说的。
17.读书之后做笔记,第一次要求写上万字之后依次递减,最后把一本书缩短为几百字或者一句话。
18.要学会模仿,可以多参与一些群体性表达游戏,类似狼人杀。模仿别人的表达方式,既锻炼了思维又锻炼了表达。
19.去学一下哈佛论文格式,其实英美国家的论文非常讲究逻辑,学了真的思路会清晰很多。自己也可以做训练,比如把想说的话提炼成三四个要点,再用一句话总结一下
20.日常多做总结,按1234提炼关键点。首先,话题要分类。每个类别前加序号,重点内容加粗。
21.分析问题按照高中政治的套路来①是什么;②为什么;③要怎么做
22.看到一条经验,练习用英语的思维方式说话。英语都是把重要的内容先放在前面说,后面再用定状补修饰,中文刚好反过来,用一堆修饰掩盖了核心内容,所以让人抓不住重点,讲话简单明了就行了。
23.多看书,我在复习备考,有一个明显的感悟就是书看多了脑子自然就有条理了,吵架也变得得心应手。
24.最重要的一点,就是时刻从群众的角度思考,他们想看到什么。然后简单一点按时间顺序叙述,复杂一点按情感发展顺序叙述,再复杂一点,按因果关系叙述。
25.多看书,少上网。多看经典的文史哲,专业的作者写的书,对提高语言逻辑帮助很大。
26.遇事多思考,想得到才能说的到。
Meta 刚刚低调发布了一个最小且快速的 LLM大模型训练和推理框架库Meta Lingua。 目的是让更多人来训练 llama。可以 24 小时训练出一个 llama 7B,MMLU达到 48%。在许多下游任务上获得了非常强大的性能,并且与DCLM 基线 1.0的性能相匹配。 #AI

训练一个国产大模型只需要 10 万人民币,费用计算: $2.50/h(租用一个 H100) × 256个(h100 gpu) × 24H = $15,360。

Meta Lingua主要特点 :
- 允许用户快速入门,而无需安装和配置大量依赖项。
- 用于研究的最小且快速的 LLM 训练/推理库。
- 使用可修改的 PyTorch 组件来试验架构、损失、数据
- 支持端到端训练、推理和评估 。
- 代码的模块化使其具有高度可重用性,灵活性,使研究人员能够即插即用各种组件,更快地迭代和验证新概念。

开源项目 Github 地址
claude + gamma + napkin 的组合好用到爆炸,做一个技术分享的 PPT 就只需要两个小时。

1、整理素材给到 claude 帮我输出 markdown 文案;
2、文案放到 gamma 中来生成 ppt 演示稿;
3、用 napkin 来根据文案生成一些图表搭配放到 gamma 中。 claude.ai
沃顿商学院给教师和学生的提示词库 #AI
----------------------------------
沃顿商学院发布了一个专门用来教学的提示词库,里面包含了非常多用于学习和教育的提示词,同时也有一些其他很有用的提示,比如密度链总结、因果关系解释、产品发布提示和学术论文创建。我翻译了所有的提示词,如果你有孩子或者本身就是学生和教师可以收藏一下。
Back to Top