一个基于 Google Gemini 2.0的高精度 OCR 文字识别应用,支持多国语言和手写字体识别。
- 🚀 高精度文字识别
- 🌍 支持多国语言识别
- ✍️ 支持手写字体识别
- 🎨 优雅的渐变动画效果
- 📱 响应式设计,支持移动端
- 🖼️ 多种图片输入方式:
- 文件上传
- 拖拽上传
- 粘贴板上传
- 图片链接上传
本项目使用 Vercel 进行部署。在部署时需要设置以下环境变量:
GEMINI_API_KEY
- 访问 Google AI Studio (https://aistudio.google.com/)
- 点击左上角的 "Get API key" 按钮
- 按照提示完成 API key 的创建
注意事项:
- 需要使用非香港、澳门、大陆地区的网络环境访问
- Node.js 16.x 或更高版本
- npm 或 yarn
- 克隆项目
git clone https://github.com/cokice/googleocr-app.git
cd ocr-app
- 安装依赖
npm install
# 或
yarn install
- 配置环境变量
创建
.env.local
文件并添加以下配置:
REACT_APP_GEMINI_API_KEY=your_api_key_here
- 启动开发服务器
npm start
# 或
yarn start
访问 http://localhost:3000 即可看到应用。
- React.js
- Google Gemini Vision API
- CSS3 动画
- React Markdown
- Vercel 部署
- 支持拖拽上传
- 支持粘贴上传(包括截图和图片文件)
- 支持图片链接上传
- 支持多图片批量上传
- 实时流式输出
- 优雅的渐变动画效果
- 支持多国语言
- 支持手写体识别
- 自动优化排版格式
- 支持 Markdown 格式
- 一键复制识别结果
- 图片预览功能
- 多图片导航切换
- 请确保您的 Google Gemini API 密钥有足够的配额
- 图片链接需要允许跨域访问
- 建议上传清晰的图片以获得最佳识别效果
- 数学公式应有清晰的结构
欢迎提交 Issue 和 Pull Request。
MIT License