Neural Engine v3

分布式神经网络推理平台 · 支持全模态大模型 · 毫秒级流式响应

AI 对话 · 流式输出

实时演示大语言模型的流式推理过程

🧠
New API Assistant
● 就绪
👤
介绍一下 New API 的核心能力
🤖

AI 图像生成

文本到图像,扩散模型实时推理

Diffusion Model 推理中...

请求处理链路

📥
接入层
🔐
鉴权
⚖️
负载均衡
🧠
模型推理
📤
流式响应

六大核心能力

从文本到多模态,覆盖 AI 应用全场景

💬

Chat Completions

流式对话,兼容 OpenAI 格式,Function Calling 开箱即用

GPT-5ClaudeStreaming
🎨

Image Generation

文本到图像,多种分辨率,内置 DALL·E / SD 引擎

DALL·ESDXL4K
🎙️

Speech & TTS

语音识别、合成、翻译,支持 50+ 语言

WhisperTTS多语言
🔢

Embeddings

高维向量嵌入,语义搜索与 RAG 的最佳拍档

RAG向量搜索语义匹配
👁️

Vision

多模态视觉理解,图像描述、OCR、目标检测

OCR视觉问答多图
🔗

Model Router

智能模型路由,自动选择最优模型,成本与质量平衡

自动路由故障转移A/B

三行代码,即刻调用

兼容 OpenAI SDK,零迁移成本

terminal — api.new-api.dev
POST/v1/chat/completions// 对话补全
GET/v1/models// 模型列表
POST/v1/images/generations// 图像生成
POST/v1/audio/transcriptions// 语音识别
POST/v1/embeddings// 向量嵌入
"id": "chatcmpl-9xK3nN2m...", "model": "gpt-5.2", "choices": [{ "index": 0, "message": { "role": "assistant", "content": "Hello, world! 🚀" } }], "usage": { "total_tokens": 42 }

性能数据

0
可用性 %
0
平均延迟 ms
0
日调用量 +
0
全球节点

接入下一代 AI 能力

免费注册,即刻获得 100 万 Token