门户网站

Github

Online project hosting using Git. Includes source-code browser, in-line editing, wikis, and ticketing. Free for public open-source code.

Gitee

Gitee - 基于 Git 的代码托管和研发协作平台


个人部署

Sealos

基于Kubernetes的云操作系统发行版,旨在简化云原生应用的部署和管理。它集成了Kubernetes及其相关组件,如Docker、Dashboard、Ingress等,使用户能够快速搭建起一个功能完备的云原生应用运行平台。

Dify - 个人部署

‌Dify‌是一个开源的大语言模型(LLM)应用开发平台,旨在简化和加速生成式AI应用的创建和部署。Dify融合了后端即服务(Backend as Service, BaaS)和LLMOps的理念,提供了从Agent构建到AI workflow编排、RAG检索、模型管理等能力,帮助用户轻松构建和运营生成式AI原生应用‌。

Ragflow - 官方演示平台

一款基于深度文档理解的开源RAG(Retrieval-Augmented Generation)引擎,旨在提升生成式AI系统的效率和性能。它结合了数据检索与生成式模型,能够在海量数据中快速定位相关信息,并生成符合上下文语义的自然语言回复。

coze 扣子智能体

Coze提供可视化设计与编排工具,0代码快速搭建基于大模型的各类AI项目,满足你的个性化需求,并支持一键发布到各大平台。

coze 扣子资源库

Coze提供可视化设计与编排工具,0代码快速搭建基于大模型的各类AI项目,满足你的个性化需求,并支持一键发布到各大平台。

飞书文档

AI时代先进生产力平台。不仅提供一站式办公协同协作套件,帮助企业协同提效、人才管理提效、业务管理提效;还提供多元化的 AI 产品。

xata

Xata是一个完全托管的PostgreSQL数据库的平台,提供的免费使用额度:15 GB 空间,共享环境。


开源排行榜

Github-Daily-Rank

Github开源项目:每天📈飙升榜 top10,每天早上8:30更新.

Chinese-Top-Charts

GitHub中文排行榜,各语言分设「软件 | 资料」榜单,精准定位中文好项目。各取所需,高效学习。

Github-Ranking

⭐Github Ranking⭐ Github stars and forks ranking list. Github Top100 stars list of different languages. Automatically update daily. | Github仓库排名,每日自动更新

Open Github

Open Github社区:挖掘Github优质项目,帮助用户发现有趣、实用、流行的开源项目。

爬爬虾技术资源

爬爬虾技术资源汇总 ,分享好玩实用软件DIY B站,抖音,公众号,Youtube全网同名。

HelloGitHub

分享 GitHub 上有趣、入门级的开源项目。每月 28 号以月刊的形式更新发布,内容包括:有趣、入门级的开源项目、开源书籍、实战项目、企业级项目等,让你用很短时间感受到开源的魅力,爱上开源!


AI新闻

Zeli

提供了Hacker News和HuggingFace每日AI论文的中文版,实时翻译并生成摘要,旨在帮你快速挑选感兴趣的文章来读。


AI导航

AI138

AI工具网是专业的AI工具导航平台,汇集超过800种国内外AI人工智能工具,专为AI创作者和开发者设计,涵盖智能对话、AI绘画、创意写作、多语言翻译、3D设计、视频编辑和语音合成等高效工具。AI工具导航为您推荐最优秀的人工智能工具,助您提升工作效率和创造力!

AI工具集

AI工具集,AI工具集官网,AI工具集网站,AI工具集导航,ai-bot.cn,AI工具集导航官网,AI工具导航,AI工具大全,AI网站大全,AI软件大全,AI工具集合,AI工具集合网,AI工具库,AI工具箱,AI工具箱导航

OpenI

OpenI是一个专门收录各种AI工具和资源的导航网站。主要涵盖常用工具、大模型、智能体、AI工具集、AI开发者社区、AI图像工具、AI视频工具、AI办公工具、AI商业服务、AI权威机构、AI竞赛这些类别。

AI 工具箱导航

AI 工具箱导航

AI平台

AI应用工具平台,收录了国内外数百个AI优秀工具,为AI创作者提供绘画创作、智能对话、翻译辅助、3D设计、视频生成、语言合成等各类精选AI工具。


编程学习

菜鸟教程

提供了编程的基础技术教程, 介绍了HTML、CSS、Javascript、Python,Java,Ruby,C,PHP , MySQL等各种编程语言的基础知识。 同时本站中也提供了大量的在线实例,通过实例,您可以更好的学习编程

程序员工具站

程序员工具站集合了程序员常用的网址导航和工具,数据内容全部来自互联网。

Microsoft PowerToys

Microsoft PowerToys 是一组实用工具,可帮助高级用户调整和简化其 Windows 体验,从而提高工作效率。。


技术博客

IT宅

IT宅是帅旋打造的一个分享软件开发技术,项目经验,面试宝典,行业动态等的技术博客。

Ruanyf

Ruanyf


开发技术

deepseek-integration

Integrate the DeepSeek API into popular softwares。

飞算JAVA AI

Integrate the DeepSeek API into popular softwares。

软开企服 - JVS低代码开发平台

用JVS,轻松构建您的数字化平台,数字化企业所需,先进的思想与落地的服务。

翱途 - o2oa

O2OA开发平台凭借其强大的核心功能和丰富的内置应用,能够帮助企事业单位快速、高效地构建协同办公系统,满足各类业务需求。

radix-ui

Radix UI 是一个以灵活性和可扩展性为特点的组件库,旨在解决传统组件库预设大量样式、难以覆盖的问题。Radix UI 通过无头组件(Headless Components)和无样式组件(Unstyled Components)的设计理念,为开发者提供了更强大的自定义能力。

Mantine

Mantine.js 是一个旨在提供卓越用户体验和开发者体验的 React 组件库。

Radix Vue

无样式、可访问的组件,用于在 Vue 中构建高质量的设计系统和 Web 应用程序。

Flutter

无Flutter 是由 Google 创建的免费开源移动应用开发框架。使用 Flutter,您可以从单一代码库中为移动端、Web 和桌面创建优美、快速的用户体验。


大模型理论

Awesome-LLM-Learning

大语言模型学习的仓库,旨在为大语言模型学习入门者和大语言模型研发岗位的面试准备者提供全面的基础知识。

llm-action

本项目旨在分享大模型相关技术原理以及实战经验(大模型工程化、大模型应用落地)

llm-course

Course to get into Large Language Models (LLMs) with roadmaps and Colab notebooks

AI-Resources-Central

汇集来自全球的优秀人工智能(AI)开源项目。无论你是寻找灵感来启动自己的项目,还是想要学习如何使用最新的AI技术,这里都是一个绝佳的起点

llm-universe

面向小白开发者的大模型应用开发教程,旨在基于阿里云服务器,结合个人知识库助手项目,通过一个课程完成大模型开发的重点入门

开源大模型食用指南

针对中国宝宝量身打造的基于Linux环境快速微调(全参数/Lora)、部署国内外开源大模型(LLM)/多模态大模型(MLLM)教程

LLMForEverybody

每个人都能看懂的大模型知识分享,LLMs春/秋招大模型面试前必看,让你和面试官侃侃而谈

Hands-On Large Language Models

About Official code repo for the O'Reilly Book - "Hands-On Large Language Models

Brex's Prompt Engineering Guide

Tips and tricks for working with Large Language Models like OpenAI's GPT-4.

Awesome-LLM

Awesome-LLM: a curated list of Large Language Model.

ToolBench

An open platform for training, serving, and evaluating large language model for tool learning.

Pythia

The hub for EleutherAI's work on interpretability and learning dynamics.

LLM-Agent-Paper-List

The paper list of the 86-page paper "The Rise and Potential of Large Language Model Based Agents: A Survey" by Zhiheng Xi et al.

Awesome-Multimodal-Large-Language-Models

Latest Advances on Multimodal Large Language Models.

DeepSpeed

DeepSpeed is a deep learning optimization library that makes distributed training and inference easy, efficient, and effective.


大模型资源

硅基流动

硅基流动致力于打造规模化、标准化、高效能 AI Infra 平台,提供高效能、低成本的多品类 AI 模型服务,助力开发者和企业聚焦产品创新。

阿里云百炼

阿里AI依托阿里领先的云基础设施、大数据和AI工程能力、场景算法技术和多年行业实践,一站式地为企业和开发者提供云原生的AI能力体系。帮助提升AI应用开发效率,促进AI在产业中规模化落地,激发业务价值。

火山引擎

豆包大模型 通过字节跳动内部50+业务、多场景实践验证,日均超4万亿tokens大使用量,提供多模态的能力,以优质的模型效果为企业打造丰富的业务体验.

华为云盘古大模型

盘古大模型以 “AI for insdustries”为核心理念,包含NLP大模型、CV大模型、多模态大模型、预测大模型、科学计算大模型5类大模型,使能行业AI升级。

Ollama

Ollama 是一个基于 Go 语言开发的可以本地运行大模型的开源框架。

Huggingface

The AI community building the future.

魔搭社区

汇聚各领域最先进的机器学习模型,提供模型探索体验、推理、训练、部署和应用的一站式服务。


运行平台

Ollama

Ollama 是一个基于 Go 语言开发的可以本地运行大模型的开源框架。

Ktransformers

A Flexible Framework for Experiencing Cutting-edge LLM Inference。

vLLM

A high-throughput and memory-efficient inference and serving engine for LLMs。

Xorbits Inference

Xinference gives you the freedom to use any LLM you need. With Xinference, you're empowered to run inference with any open-source language models, speech recognition models, and multimodal models, whether in the cloud, on-premises, or even on your laptop.

LocalAI

LocalAI is the free, Open Source OpenAI alternative. LocalAI act as a drop-in replacement REST API that’s compatible with OpenAI API specifications for local inferencing. It allows you to run LLMs, generate image…

FastChat

FastChat is a GitHub repository that provides training, serving, and evaluation tools for chatbots based on state-of-the-art models. It also hosts Chatbot Arena, a website for comparing and voting on different LLMs…


本地部署

claw cloud

Clawcloud是一个提供免费容器服务的平台,每月5美元的额度可以享受4核8G内存10G磁盘和10G网络带宽的高性能容器。

vercel

一个支持静态和动态网站部署的云服务平台,其特点包括个人版免费、内置CICD、自动部署、GitHub集成和丰富的集成能力。

Deepseek模型 - Github

This code repository and the model weights are licensed under the MIT License. DeepSeek-R1 series support commercial use, allow for any modifications and derivative works, including, but not limited to, distillation for training other LLMs.

Qwen模型 - Github

The official repo of Qwen (通义千问) chat & pretrained large language model proposed by Alibaba Cloud.

Huggingface - Github

The AI community building the future.


在线模型

Deepseek

成立于2023年,专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。

Minimaxi

成立于2023年,专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。

超算互联网

超算互联网计算服务 人工智能服务 集成算力、数据、模型三大要素,提供一站式AI服务:自助获取AI算力,按需获取业内通用数据集,一键部署热点大模型运行环境;支持超大规模训练任务。

腾讯元宝

腾讯元宝是基于腾讯混元大模型的AI应用,可以帮你写作绘画文案翻译编程搜索阅读总结的全能助手。

百度Deepseek

整合文心大模型与DeepSeek的模型能力,百度AI搜索打造更个性化的搜索体验,免费不卡顿,真正实现AI普惠。

千问AI

Qwen 2.5 VL 免费官方平台;可以直接使用官方的免费平台来使用,当然免费平台是共享GPU,有额度限制。唯一的好处可以直接免费使用 Qwen 2.5 VL 最强的78B模型!本地部署文章https://www.freedidi.com/18497.html。

通义千问

阿里云推出的语言模型,属于(AI Generated Content,AIGC)领域,是一个MaaS(模型即服务)的底座。为多模态大模型(Multimodal Models)。

通义万象

阿里云通义系列AI绘画创作大模型,由阿里巴巴研发,该模型可辅助人类进行图片、视频创作。

扣子

Coze提供可视化设计与编排工具,0代码快速搭建基于大模型的各类AI项目,满足你的个性化需求,并支持一键发布到各大平台。

豆包

文本写作ai,豆包ai,快速生成文章/文案/稿件/月周日报//脚本/摘要/故事等,文案质量高,即刻提高工作学习效率,点击立即体验!

Kimi

由月之暗面科技有限公司(Moonshot AI)开发的人工智能助手,擅长中英文对话,功能强大,支持联网和高达20万字的超长文本输入。

文心一言

百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动、回答问题、协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强的技术优势。

HiFox AI

一站式AI应用平台,该平台集成了各大AI模型资源,提供了丰富的AI应用场景,支持用户定制个性化AI应用,并通过工作流和批量处理功能帮助用户自动化完成各类复杂任务。

天工AI

天工是一款支持搜索、写作、对话、文档分析、画画、做PPT的全能型AI助手。你可以借助AI技术,检索信息、多语言翻译、写论文、写代码、写方案、写汇报、做PPT、归纳总结文档和音频视频,还可以智能编辑彩页和宝典,让AI生成高质量彩页内容。

知乎直达

天工是一款支持搜索、写作、对话、文档分析、画画、做PPT的全能型AI助手。你可以借助AI技术,检索信息、多语言翻译、写论文、写代码、写方案、写汇报、做PPT、归纳总结文档和音频视频,还可以智能编辑彩页和宝典,让AI生成高质量彩页内容。

Gemini

Experience faster and smarter AI with our experimental model, the latest version of Gemini。Gemini is getting smarter.

Google AI Studio

Google AI Studio 是一个强大的在线平台,旨在让用户能够方便地与 Google 先进的 AI 模型(如 Gemini 系列)进行交互、实验和开发。无论您是想快速测试一个想法,还是需要精细调整模型的行为,AI Studio 都提供了直观的界面和丰富的控制选项。

Grok3

Grok is a free AI assistant designed by xAI to maximize truth and objectivity. Grok offers real-time search, image generation, trend analysis, and more.

ChatGPT免费接入口

ChatGPT免费接入口


生图|视频|音频模型


图片生成
Raphael AI

一款免费的AI图像生成工具,无需注册即可无限次生成图像。Raphael AI采用了先进的FLUX.1-Dev模型,只需打开网页就能在线操作使用,直接通过输入文本提示词即可生成高质量的图像。

星流

Star-3 Alpha,星流图像大模型,拒绝AI油皮感,创作真实又自然.各种风格轻松驾驭,. 无需复杂控制即可轻松创建专业级作品。


视频生成
即梦AI

一站式AI创作与内容平台。支持高质量AI图像和视频生成,激发无限想象力,让灵感即刻成片。即梦AI支持文字绘图、文字生成视频和图片生成视频,并提供创作灵感。

海螺AI

海螺AI是MiniMax基于自研的多模态大语言模型为用户打造的AI伙伴, 可以帮你智能搜索问答、精准识图解析、沉浸语音通话、专业/创意写作、文档速读总结、还有独家悬浮球功能帮你把琐事化繁为简。

密塔AI-今天学点啥

秘塔的这个AI新功能,它能把任何你看不懂的文档、网页链接,甚至是随手拍的书籍照片,变成一节有PPT、有语音讲解、带动画、还能出题考你的视频课。


音频生成
网易天音

网易天音AI创作平台,词曲编唱样样精通,海量风格全部免费使用,还不快来点亮你的音乐天赋!

Noiz.ai

Noiz Studio是一个在线AI音频工具,可以用3-10秒的录音克隆您的专属声音,并生成多种语言的视频配音。

ttsmaker 在线AI配音工具

TTSMaker(马克配音)是一个免费的AI配音平台,可以将文本转换成语音,支持50多种语言和300多种语音风格,包括各种热门短视频声音,强大的神经网络使语音听起来更加自然,您可以在线试听,或者按mp3、wav格式下载音频文件。


MCP

MCP for Beginners

This open-source curriculum is designed to teach the concepts and fundamentals of the Model Context Protocol (MCP), with practical examples in .NET, Java, TypeScript, JavaScript and Python.

Open-Source MCP servers

Production-ready and experimental MCP servers that extend AI capabilities through file access, database connections, API integrations, and other contextual services.

Awesome-MCP-ZH

MCP 资源精选, MCP指南,Claude MCP,MCP Servers, MCP Clients

Huggingface - Github

The AI community building the future.

Manus

Manus 是一款通用型 AI 助手,能将想法转化为行动:不止于思考,更注重成果。Manus 擅长处理工作与生活中的各类任务,在你安心休息的同时,一切都能妥善完成。


应用框架

Open WebUI

Open WebUI is an extensible, self-hosted interface for AI that adapts to your workflow, all while operating entirely offline; Supported LLM runners include Ollama and OpenAI-co...

Open WebUI - Github

User-friendly AI Interface (Supports Ollama, OpenAI API, ...)

RAGflow

RAGFlow是一个专为深度文档理解和检索增强生成而设计的引擎,它结合了预训练的大型语言模型(LLMs)和高效的检索技术,为用户提供了一个强大的工具来处理复杂的问题和场景。

RAGflow -Github

RAGFlow是一个专为深度文档理解和检索增强生成而设计的引擎,它结合了预训练的大型语言模型(LLMs)和高效的检索技术,为用户提供了一个强大的工具来处理复杂的问题和场景。

Dify

开源的 LLM 应用开发平台。提供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等能力,轻松构建和运营生成式 AI 原生应用。

Dify - Github

开源的 LLM 应用开发平台。提供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等能力,轻松构建和运营生成式 AI 原生应用。

n8n

n8n是一个低代码的自动化工作流管理系统,可以用拖放的方式创建复杂的工作流,无需编写代码。n8n支持各种应用和服务的集成,包括AI组件,适用于数据同步、客户关系管理、IT自动化等多种业务场景。

n8n - Github

n8n是一个低代码的自动化工作流管理系统,可以用拖放的方式创建复杂的工作流,无需编写代码。n8n支持各种应用和服务的集成,包括AI组件,适用于数据同步、客户关系管理、IT自动化等多种业务场景。

LinkAI

一站式AI智能体搭建平台,聚合文本、语音、图像等多模态模型,提供知识库RAG、插件、工作流Agent等增强能力,并支持零代码接入企业微信、公众号、微信客服、钉钉、飞书等多种应用渠道,助力个人和企业完成AI大模型的行业落地。

CoW LinkAI - Github

基于大模型搭建的聊天机器人,同时支持 微信公众号、企业微信应用、飞书、钉钉 等接入,可选择GPT4.1/GPT-4o/GPT-o1/ DeepSeek/Claude/文心一言/讯飞星火/通义千问/ Gemini/GLM-4/Kimi/LinkAI,能处理文本、语音和图片,访问操作系统和互联网,支持基于自有知识库进行定制企业智能客服。

FastGPT

FastGPT 对外的 API 接口对齐了 OpenAI 官方接口,可以直接接入现有的 GPT 应用,也可以轻松集成到企业微信、公众号、飞书等平台。

FastGPT - Github

FastGPT 对外的 API 接口对齐了 OpenAI 官方接口,可以直接接入现有的 GPT 应用,也可以轻松集成到企业微信、公众号、飞书等平台。

Langchain

Langchain 是一个开源框架,它允许开发人员将像 GPT-4 这样的大型语言模型与外部的计算和数据源结合起来。

Langchain - Github

Langchain 是一个开源框架,它允许开发人员将像 GPT-4 这样的大型语言模型与外部的计算和数据源结合起来。

Cherry-ai

Cherry Studio AI 是一款强大的多模型 AI 助手,支持 iOS、macOS 和 Windows 平台。快速切换多个先进的 LLM 模型,提升工作学习效率。

Cherry-ai - Github

Cherry Studio AI 是一款强大的多模型 AI 助手,支持 iOS、macOS 和 Windows 平台。快速切换多个先进的 LLM 模型,提升工作学习效率。

Chat Box

Chatbox AI 是一款 AI 客户端应用和智能助手,支持众多先进的 AI 模型和 API,可在 Windows、MacOS、Android、iOS、Linux 和网页版上使用。

Chat Box - Github

Chatbox AI 是一款 AI 客户端应用和智能助手,支持众多先进的 AI 模型和 API,可在 Windows、MacOS、Android、iOS、Linux 和网页版上使用。

Chat Wiki

ChatWiki 免费开源大模型企业私有知识库问答机器人 基于LLM 大模型+ RAG 检索增强生成技术 支持一键本地部署,开箱即用 兼容全球 20 多种主流大模型 多种渠道全面触达:H5、Web、微信公众号、...

Chat Wiki - Github

ChatWiki 免费开源大模型企业私有知识库问答机器人 基于LLM 大模型+ RAG 检索增强生成技术 支持一键本地部署,开箱即用 兼容全球 20 多种主流大模型 多种渠道全面触达:H5、Web、微信公众号、...

AnythingLLM

AnythingLLM 是开源免费且支持多模态交互的全栈 AI 客户端。AnythingLLM支持文本、图像和音频等多种输入方式,将任何文档或内容转化为上下文,供各种语言模型(LL...

AnythingLLM - Github

The all-in-one Desktop & Docker AI application with built-in RAG, AI agents, No-code agent builder, and more.

Lobe-chat

an open-source, modern-design AI chat framework. Supports Multi AI Providers( OpenAI / Claude 4 / Gemini / Ollama / DeepSeek / Qwen), Knowledge Base (file upload / knowledge management / RAG ), Multi-Modals (Plugins/Artifacts) and Thinking. One-click FREE deployment of your private ChatGPT/ Claude / DeepSeek application.

Lobe-chat - Github

an open-source, modern-design AI chat framework. Supports Multi AI Providers( OpenAI / Claude 4 / Gemini / Ollama / DeepSeek / Qwen), Knowledge Base (file upload / knowledge management / RAG ), Multi-Modals (Plugins/Artifacts) and Thinking. One-click FREE deployment of your private ChatGPT/ Claude / DeepSeek application.

ComfyUI

comfyui免费在线AI绘画,stablediffusion原生界面,不用安装,无需显卡,模型畅选使用.}欢迎每一位创作者加入,创作和分享你的作品.与中国原创模型作者交流,共同探索AI绘画。

ComfyUI - Github

comfyui免费在线AI绘画,stablediffusion原生界面,不用安装,无需显卡,模型畅选使用.}欢迎每一位创作者加入,创作和分享你的作品.与中国原创模型作者交流,共同探索AI绘画。

Stable Diffusion

table Diffusion是一种潜在扩散模型(Latent Diffusion Model),能够从文本描述中生成详细的图像。它还可以用于图像修复、图像绘制、文本到图像和图像到图像等任务。

Stable Diffusion - Github

table Diffusion是一种潜在扩散模型(Latent Diffusion Model),能够从文本描述中生成详细的图像。它还可以用于图像修复、图像绘制、文本到图像和图像到图像等任务。


Make

Make.com 是一款基于云的自动化平台,旨在通过可视化界面帮助用户轻松创建、构建和自动化各种任务。与传统的无代码 iPaaS(集成平台即服务)平台不同,Make.com 提供了非线性和直观的操作体验,使用户能够以更灵活的方式设计和实现自动化流程。

OpenManus - Github

Manus is incredible, but OpenManus can achieve any ideas without an Invite Code 🛫!

UI-TARS - Github

A GUI Agent application based on UI-TARS(Vision-Language Model) that allows you to control your computer using natural language.

AutoGen - Github

AutoGen is a framework for creating multi-agent AI applications that can act autonomously or work alongside humans.

AutoGen - Microsoft

AutoGen is a framework for creating multi-agent AI applications that can act autonomously or work alongside humans.

vision-agent - Github

Vision Agent 是由 LandingAI(吴恩达团队) 开发的一个开源项目,旨在帮助用户快速生成解决计算机视觉任务的代码。它利用先进的代理框架和多模态模型,通过简单的提示即可生成高效的视觉AI代码,适用于图像检测、视频跟踪、对象计数等多种场景。

Proxy-lite - Github

Proxy Lite 是开源的轻量级视觉语言模型(VLM),参数量为3B,支持自动化网页任务。Proxy Lite 能像人类一样操作浏览器,完成网页交互、数据抓取、表单填写等重复性工作,显著降低自动化成本。

GrokX国内镜像网站 - GitHub

GrokX国内镜像网站.


垂直领域

Awesome Chinese LLM

整理开源的中文大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等。

Awesome AI Tools

整理开源的中文大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等。

Awesome-LLM

Awesome-LLM: a curated list of Large Language Model


PDF

Stirling-PDF

基于 Docker,支持本地托管的 Web 端的 PDF 工具箱,允许对 PDF 文件执行各种操作,例如拆分合并、转换、添加图像、旋转、压缩、添加和删除密码、检测并删除空白页等。

PDF-Guru

PDF Guru Anki是一款以PDF为中心的多功能办公学习工具箱软件,包含四大板块功能:PDF实用工具箱、Anki制卡神器、Anki最强辅助、视频笔记神器,软件功能众多且强大,熟练运用可以大幅提高办公和学习效率,绝对是您不可多得的效率神器。

PDF24

Repository for the PDF24 Online PDF Tools。


OCR识别

MinerU

2024年7月,上海人工智能实验室OpenDataLab团队正式推出了智能数据提取工具——MinerU。具备将混合图片、公式、表格、脚注等在内的复杂多模态 PDF 文档转化为Markdown格式的能力,可大幅提升AI语料的准备效率

Mistral

“Mistral AI”是一家由前DeepMind和Meta Platforms(META.US)的研究人员组建的致力于构建大型通用人工智能(AGI)模型的初创公司。总部位于巴黎,该公司由微软、英伟达提供支持。

Demo - olmOCR

PDF解析工具:Toolkit for linearizing PDFs for LLM datasets/training

Github - olmOCR

PDF解析工具:Toolkit for linearizing PDFs for LLM datasets/training

Demo - getomni-ai

OCR & Document Extraction using vision models

Github - getomni-ai

OCR & Document Extraction using vision models

Github - OCRmyPDF

OCRmyPDF adds an OCR text layer to scanned PDF files, allowing them to be searched

Github - GOT-OCR2.0

Official code implementation of General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model

Github - tesseract-ocr

Tesseract Open Source OCR Engine (main repository)

Github - Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。

Demo - EasyOCR

Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc.

Github - EasyOCR

Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc.

Github - marker

Convert PDF to markdown + JSON quickly with high accuracy

Github - surya

OCR, layout analysis, reading order, table recognition in 90+ languages

Github - InternVL

Oral] InternVL Family: A Pioneering Open-Source Alternative to GPT-4o. 接近GPT-4o表现的开源多模态对话模型


在线翻译

沉浸式翻译

沉浸式翻译支持 10+ 翻译服务,拥有强大的文档解析算法,并针对不同格式的文档适配不同的翻译格式。


导航

发现导航 - Github

一个纯静态、支持SEO、在线编辑的强大导航网站


回到顶端

KW's导航

导航网站