皮纳塔射击
我的作品
我开发了一个SaaS 截图管理器,帮助用户可以轻松上传、分类和搜索他们的截图。该应用利用了Pinata的Files API来实现去中心化的图像存储,并集成了GROQ API的LLaMA 3.2 11B以进行截图的AI驱动分析功能。它具备OCR(光学字符识别)文本提取、自动分类及可搜索的截图画廊等功能,从而简化了大量图像和截图的管理。该应用使用Next.js在Vercel上部署,以确保可扩展性和速度。
限制此版本的应用程序的一个限制是在使用GROQ API时只能一次处理一张图片。这一限制源于GROQ的LLaMA 3.2 11B模型当前API的限制,该模型每次请求只能处理一张图片。虽然这允许每个截图都能精准分类和命名,但这样就限制了批量处理的功能。
然而,Pinata 在这个设置中表现出色,它能够无缝处理多个图像的去中心化存储。得益于 Pinata 的强大且可靠的 基于 IPFS 的存储系统,用户一次可以上传多个截图,并且这些截图可以安全存储并轻松检索,即使等待 AI 分析也依然可以轻松检索。
演示试试这个 Demo。
这里有几个关键功能:
- 上传接口:
拖放上传截图文件并即时得到AI分析结果。
- 对图像提问:
你可以对上传的截图或图片提问。
- 截图集:
截图会自动命名,命名内容就是AI的描述。
- 文本搜索:
使用OCR功能在截图中的文字进行搜索,比如收据或文档等。
我的代码段你可以访问这个Github页面来查看项目的源代码。
技术堆栈
- Next.js(前端和后端,包含无服务器API路由)。
- Pinata的Files API(用于IPFS上的去中心化文件存储和检索)。
- GROQ API的LLaMA 3.2 11B(用于视觉能力和文本提取)。
- Vercel(确保可扩展性和速度的部署平台)。
- Tailwind CSS(用于样式和响应式UI)。
- Shadcn/ui 和 Aceternity UI(UI组件库)。
-
Pinata的文件API 用于确保截图的安全存储并通过IPFS提取它们,确保去中心化存储和高可靠性。Pinata在管理多个文件方面表现出色,让用户能够快速存储和访问他们的截图,即使处理大量截图也是如此。
- AI分析 使用 GROQ 的 LLaMA 3.2 11B 模型自动将截图分类为依据内容的合适名称,并通过 OCR 技术提取文本,便于轻松搜索。虽然每个图像需要逐个处理,但 Pinata 的去中心化存储通过允许用户一次上传多个图像并排队等待 AI 处理,使这一过程变得可行和高效。
这种结合了Pinata的去中心化存储和GROQ AI能力的工具对各种类型的用户都非常有用——无论是工作中的使用、个人组织,还是创意项目。
未来的改进措施- 批量图像处理功能:通过探索批处理图像分析的选项来克服单一图像的限制。
- 高级分类算法技术。
- 增强搜索功能,利用更精细的OCR文本提取。
- 用户身份验证和个人相册。
- 实时协作,便于分享和整理截图。
要在本地运行此项目,请按照以下步骤来。
# 1. 克隆代码库
git clone https://github.com/yourusername/screenshot-organizer.git
cd screenshot-organizer
# 2. 安装依赖
npm install
# 3. 设置环境变量
# 在根目录下创建一个 .env.local 文件,并添加如下内容:
PINATA_API_KEY=your_pinata_api_key
PINATA_SECRET_API_KEY=your_pinata_secret_key
GROQ_API_KEY=your_groq_api_key
# 4. 启动开发服务器
npm run dev
# 5. 在浏览器中打开并导航到
http://localhost:3000
进入全屏 退出全屏
devchallenge #pinatachallenge #webdev #api #去中心化存储 (#decentralizedstorage) #AI分析 (#AIanalysis) #摩洛哥AI (#MoroccoAI)