- Published on
[置顶]2024 年飞桨开源社区年度报告
2024 年已悄然落幕。这一年,飞桨开源社区在挑战与机遇中不断成长与突破。在这新年伊始,我们为大家呈上一份 2024 年度报告,以此致敬每一位开发者的努力与贡献。
Wonderful stories from PaddlePaddle contributors
2024 年已悄然落幕。这一年,飞桨开源社区在挑战与机遇中不断成长与突破。在这新年伊始,我们为大家呈上一份 2024 年度报告,以此致敬每一位开发者的努力与贡献。
什么是开源项目和开源社区?国内活跃度 Top 的开源社区,都有哪些有趣的人和事?开源社区之于开源项目有何重要意义?
写在前面: 这不是一篇正经的技术战报,而是一个“乌镇闲散人员”的碎碎念。关于怎么跨越半个中国去领奖,关于嘉兴的雨,关于飞桨社区在世界互联网大会上的那些事儿。
在大型语言模型(LLM)的应用落地中,RAG(检索增强生成)是解决模型幻觉和知识时效性的关键技术。本博客将对本多文档高精度智能分析与问答系统的关键技术进行说明介绍。该系统集成了 在线 OCR 解析、Milvus 混合检索(向量+关键词) 以及 多维度的重排序(Reranker) 策略,旨在提升低资源环境下的检索准确率,以实现高精度多文档分析与问答。
还在为了一份几十页的合同,熬夜逐条对照、担心漏掉关键条款吗? 在大模型时代,这件事不该再靠人力硬扛。
I'm excited to share my journey of fine-tuning PaddleOCR-VL specifically for manga OCR tasks! The resulting model, PaddleOCR-VL-For-Manga, is ranked #3 on HuggingFace's trending leaderboard in the Image-Text-to-Text category — demonstrating the effectiveness of proper fine-tuning for language- and domain-specific tasks based on PaddleOCR-VL! 🎉
这是一篇在今年五月完成的采访,记录了 🦩 哥的个人经历,以及他在开源社区中的成长故事。由于 🦩 哥实在太能聊, 内容异常丰富,再加上主编一直忙得分身乏术,稿子就这样一拖再拖,迟迟没有发出。为了不让这次采访彻底“烂尾”,我们终于在今天把它完整整理出来,与大家分享。
9 月 9 日下午,WAVE SUMMIT 开发者分论坛迎来了一场别开生面的分享环节——“PaddlePaddle Contributor Lightning Talks” 技术快闪分享(开放麦模式)。
这是一个属于开源贡献者的舞台,也是一次关于热爱、技术与勇气的闪电碰撞。
现场汇聚了来自不同高校与背景的贡献者代表,他们用短短 5 分钟的时间,讲述与飞桨的相遇故事,分享技术思考、社区体验与个人成长。
本文梳理近期主流的 KV 压缩/驱逐思路(Prefill vs. Decoding),对比 H2O、PyramidKV、SnapKV、Quest 等代表方法的策略与表现。