1. python
一步API中文文档
  • 01_人工客服
  • 02_一步API福利群
  • 03_一步镜像站-福利群
  • 04_购买地址
  • 05_base_url说明
  • 06_API key的获取和使用
  • 07_支持的模型与在线查询
  • 08_API Key余额查询
  • 09 一镜视频平台操作指引(中文版)
  • 10 一镜视频平台操作指引(英文版)
  • 常用工具配置教程
    • 01 Chatbox 配置一步API
    • 02 PyCharm 配置一步API
    • 03 Cursor 配置一步API
    • 04 Trae AI 配置一步API
    • 05 CherryStudio 配置一步API
    • 06 Dify 配置一步API
    • 07 AingDesk 配置一步API
    • 08 VS Code 配置一步API
    • 09 IntelliJ IDEA 配置一步API
    • 10 immersivetranslate 沉浸式翻译配置一步API
    • 11 Zed 配置一步API
    • 12 DeepChat 配置一步API
    • 13 Void 配置一步API
    • 14 LibreChat 配置一步API
    • 15 Sider 配置一步API
    • 16 NextChat 配置一步API
    • 17 ChatWise 配置一步API
    • 18 Glarity 配置一步API
    • 19 Tavo 配置一步API
    • 20 OMate Chat 配置一步API
    • 21 Claude Code 配置一步API
    • 22 91写作配置
    • 23 OpenClaw自定义中转站配置教程
    • 24opencode配置一步API
    • 25Gemini CLI 配置一步API
    • 26CC switch配置一步API
    • Codex配置一步API
      • Windows
      • Mac
      • Linux
  • 聊天(Chat)
    • ChatGpt 接口
      • ChatGPT音频(Audio)
        • 创建视频
        • 音频转文字 whisper-1
        • 音频转文字 gpt-4o-transcribe
        • 创建语音 gpt-4o-mini-tts
        • 创建翻译 (不支持)
      • ChatGPT聊天(Chat)
        • 创建视频, 带图片
        • 连续修改生成视频
        • 获取令牌支持模型
        • 创建聊天识图 (流式)
        • 创建聊天识图 (流式) best64
        • 创建聊天识图 (非流)
        • 创建聊天创作图 (非流)
        • 官方Function calling调用
        • 官方N测试
        • 创建聊天函数调用
        • 创建结构化输出
        • 控制推理模型努力程度
        • 创建聊天补全 qwen-mt-turbo
        • 创建聊天补全 deepseek v3.1思考程度 (流式)
        • deepseek-ocr 识别
      • ChatGPT自动补全(Completions)
        • 创建完成
      • ChatGPT嵌入(Embeddings)
        • 创建嵌入
      • Web 搜索
        • web搜索
    • Anthropic Claude 接口
      • 创建聊天补全 (流式) [原生格式]
      • 创建函数调用 (流式) [原生格式]
      • 创建思考聊天 [原生格式]
      • 创建思考聊天
      • 创建聊天补全 (流式)
      • 创建聊天补全 (非流)
      • 创建聊天识图 (流式)
      • 创建聊天识图 (非流)
      • PDF支持 [原生格式]
      • PDF支持 [原生格式] base64格式
    • 谷歌Gemini 接口
      • 原生格式
        • 文本生成
        • 文本生成-流
        • 文本生成+思考-流
        • 图片生成
        • 图片生成 gemini-2.5-flash-image
        • 图片生成 gemini-2.5-flash-image 控制宽高比
        • 图片生成 gemini-3-pro-image-preview 控制宽高比 +清晰度
        • 图片编辑
        • 图片理解
        • 格式化输出
        • 函数调用
        • 文档理解
        • URL context [原生格式]
        • 代码执行
        • google search
        • 视频理解
        • URL context
        • 音频理解
        • Embeddings
  • 聊天(Responses)
    • 创建模型响应
    • 创建函数调用
    • 创建模型响应(流式返回)
    • 创建模型响应 (控制思考长度)
    • 创建网络搜索
    • 创建模型响应 gpt-5启用思考
  • 绘画模型
    • DALL·E 3
      • 创建 DALL·E 3
    • FLUX 系列
      • gpt 兼容格式
        • Flux 创建(OpenAI dall-e-3格式)
        • Flux编辑(OpenAI dall-e-3格式)
      • Replicate 官方格式
        • 创建任务 black-forest-labs/flux-kontext-dev
        • 查询任务
    • 豆包系列
      • doubao-seedream-4-0-250828-文生图
      • doubao-seedream-4-0-250828-图生图
      • doubao-seedream-4-0-250828-多图生图
    • gemini系列
      • gemini-3-pro-image-preview-单图编辑
      • gemini-3-pro-image-preview-文生图
  • 视频模型
    • veo 视频生成
      • OpenAI 视频格式
        • openai 创建视频,带图片
    • 万象视频生成
      • 创建视频 Copy
    • sora 视频生成
      • chat格式
        • 创建视频
        • 创建视频, 带图片
        • 连续修改生成视频
  • 音频(Audio)
    • TTS文本转语音
    • ASR语音转文本
  • 示例代码
    • python
      • 01 OpenAI-Python示例代码
      • 02 Claude-Python示例代码
      • 03 OpenAI-image-Python示例代码
      • 04 Gemini-Python示例代码
      • 05 Gemini多场景-Python代码示例
      • 06 Rerank-python示例代码
      • 07 Python分析文件代码示例
      • 08 whisper-1-Python实力代码
      • 09 dalle-3-Python示例代码
      • 10 doubao-Python示例代码
      • 11 gemini-image-Python示例代码
      • 12 gpt-image-1-Python示例代码
      • 13 sora-2-Python代码示例
      • 14_Pro/BAAI/bge-reranker-v2-m3-Python示例代码
      • 15 Gemini3 多轮工具调用示例
      • 16 Gemini image控制宽高比+清晰度代码示例
      • 17 Python其他示例
      • doubao-seedream-5-0-260128图改图示例代码
      • gemini-3理解视频
    • Java
      • 01 OpenAI-Java示例代码
      • 02 Claude-Java示例代码
      • 03 Gemini多场景-Java代码示例
  • 接口格式
    • Anthropic 对话格式(Messages)
    • Cohere 重排序格式(Rerank)
    • Deepseek reasoning 对话格式(类Chat Completions)
    • Jina AI 重排序格式(Rerank)
    • Midjourney 图像格式(Midjourney Proxy/Midjourney Proxy Plus)
    • OpenAI 音频格式
    • OpenAI 对话格式(Chat Completions)
    • OpenAI 嵌入格式(Embeddings)
    • OpenAI 图像格式(Image)
    • OpenAI 实时对话接口
    • OpenAI 响应格式(Responses)
    • Suno 音乐格式(Music)
    • Xinference 重排序格式(Rerank)
  • 搜索引擎
    • Google Serp Api
  1. python

gemini-3理解视频

import openai
import base64
import sys

这里填写您在https://yibuapi.com上创建的apikey#

api_key = "sk-xxx"

这里填写https://yibuapi.com/v1#

base_url = "https://yibuapi.com/v1"

视频文件路径#

video_path = "C:\Users\52416\Desktop\54f17be5e8ebb17719303c7c7835f297.mp4"

对视频的提问#

question = "请详细描述这个视频的内容,包括场景、人物、动作和情节。"
def encode_video(path):
with open(path, "rb") as f:
return base64.b64encode(f.read()).decode("utf-8")
def get_video_response(video_path, question, api_key, base_url):
try:
base64_video = encode_video(video_path)

根据文件扩展名确定MIME类型#

ext = video_path.rsplit(".", 1)[-1].lower()
mime_map = {
"mp4": "video/mp4",
"avi": "video/x-msvideo",
"mov": "video/quicktime",
"mkv": "video/x-matroska",
"webm": "video/webm",
}
mime_type = mime_map.get(ext, "video/mp4")
client = openai.OpenAI(api_key=api_key, base_url=base_url)
response = client.chat.completions.create(
model="gemini-3-pro-preview",
messages=[
{
"role": "user",
"content": [
{
"type": "image_url",
"image_url": {
"url": f"data:{mime_type};base64,{base64_video}"
},
},
{
"type": "text",
"text": question,
},
],
}
],
)
return response.choices[0].message.content
except Exception as e:
return f"请求失败: {str(e)}"
if name == "main":
if len(sys.argv) > 1:
video_path = sys.argv[1]
if len(sys.argv) > 2:
question = sys.argv[2]
print(f"视频: {video_path}")
print(f"问题: {question}")
print("正在分析视频,请稍候...\n")
response = get_video_response(video_path, question, api_key, base_url)
print(f"回答: {response}\n")
修改于 2026-04-23 12:22:08
上一页
doubao-seedream-5-0-260128图改图示例代码
下一页
01 OpenAI-Java示例代码
Built with