Tích hợp AI Rendervid - Tạo Video với Claude Code, Cursor & MCP

Rendervid AI Integration MCP Claude Code

Giới thiệu: Tạo Video bằng AI

Tạo video theo cách lập trình truyền thống đòi hỏi kiến thức sâu về codec video, framework animation và pipeline rendering. Rendervid loại bỏ sự phức tạp này bằng cách chấp nhận các template JSON và xuất ra video hoàn chỉnh. Khi bạn kết hợp điều này với các tác nhân AI hiểu ngôn ngữ tự nhiên, bạn sẽ có được điều gì đó mạnh mẽ: khả năng mô tả video bằng tiếng Anh đơn giản và nhận lại file MP4 đã được render.

Rendervid thu hẹp khoảng cách giữa các mô hình ngôn ngữ AI và sản xuất video. Thay vì viết code, thiết kế keyframe hoặc học cách sử dụng trình chỉnh sửa video, bạn chỉ cần nói với tác nhân AI những gì bạn muốn. Tác nhân tạo một template JSON hợp lệ, xác thực nó và render đầu ra cuối cùng thông qua engine của Rendervid. Toàn bộ quá trình diễn ra trong một cuộc hội thoại duy nhất.

Tích hợp này được xây dựng trên Model Context Protocol (MCP), một tiêu chuẩn mở cho phép các công cụ AI tương tác với các dịch vụ bên ngoài thông qua giao diện có cấu trúc. Máy chủ MCP của Rendervid cung cấp 11 công cụ bao gồm rendering, xác thực, khám phá template và tài liệu, cung cấp cho các tác nhân AI mọi thứ họ cần để tạo nội dung video chuyên nghiệp một cách tự động.


Model Context Protocol (MCP) là gì?

Model Context Protocol là một tiêu chuẩn mở được phát triển để cung cấp cho các trợ lý AI quyền truy cập có cấu trúc vào các công cụ và nguồn dữ liệu bên ngoài. Thay vì dựa vào các mô hình AI để đoán định dạng API hoặc tạo code gọi các REST endpoint, MCP cung cấp giao diện có kiểu, có thể khám phá mà các tác nhân AI có thể truy vấn tại thời điểm chạy.

Đối với việc tạo video, MCP giải quyết một vấn đề quan trọng: các tác nhân AI cần biết những gì có thể thực hiện trước khi chúng có thể tạo đầu ra hợp lệ. Không có MCP, một mô hình AI sẽ cần được đào tạo về định dạng template cụ thể của Rendervid, biết mọi animation preset có sẵn và hiểu các ràng buộc của từng loại layer. Với MCP, tác nhân chỉ cần gọi get_capabilities và nhận được mô tả đầy đủ về hệ thống, bao gồm JSON schemas cho mọi thành phần.

Tại sao MCP quan trọng cho việc tạo Video AI

  • Khám phá Runtime: Các tác nhân AI tìm hiểu những gì Rendervid có thể làm tại thời điểm họ kết nối, không phải tại thời điểm đào tạo. Điều này có nghĩa là các tính năng mới ngay lập tức có sẵn mà không cần đào tạo lại.
  • Type Safety: Mỗi công cụ có schema đầu vào và đầu ra được xác định. Tác nhân AI biết chính xác những tham số nào được yêu cầu và chúng phải có kiểu gì.
  • Xác thực trước khi Render: Thay vì gửi template và hy vọng nó hoạt động, tác nhân có thể xác thực template trước và sửa bất kỳ vấn đề nào trước khi dành thời gian cho rendering.
  • Khả năng kết hợp Công cụ: Các tác nhân AI có thể kết nối các công cụ với nhau, gọi list_examples để tìm template khởi đầu, sửa đổi nó, gọi validate_template để kiểm tra nó, và sau đó gọi render_video để tạo đầu ra. Tất cả trong một lượt hội thoại duy nhất.

Tài liệu tham khảo Công cụ Máy chủ MCP

Máy chủ MCP của Rendervid cung cấp 11 công cụ được tổ chức thành ba danh mục: Rendering, Validation & Discovery, và Documentation. Mỗi công cụ được thiết kế để cung cấp cho các tác nhân AI quyền tự chủ tối đa khi tạo nội dung video.

Công cụ Rendering

Các công cụ này xử lý việc sản xuất thực tế đầu ra video và hình ảnh từ các template JSON.

render_video

Tạo file video hoàn chỉnh từ template JSON. Đây là công cụ rendering chính để tạo đầu ra MP4, WebM hoặc MOV.

Tham số:

  • template (object, bắt buộc) – Template JSON hoàn chỉnh xác định các scene, layer, animation và cài đặt đầu ra.
  • inputs (object, tùy chọn) – Các cặp key-value để thay thế biến template.
  • output_format (string, tùy chọn) – Định dạng đầu ra: mp4, webm, hoặc mov. Mặc định là mp4.

Ví dụ sử dụng bởi tác nhân AI:

{
  "tool": "render_video",
  "arguments": {
    "template": {
      "outputSettings": {
        "width": 1080,
        "height": 1920,
        "fps": 30,
        "duration": 10
      },
      "scenes": [
        {
          "duration": 10,
          "layers": [
            {
              "type": "text",
              "text": "Summer Sale - 50% Off",
              "fontSize": 72,
              "fontFamily": "Montserrat",
              "color": "#FFFFFF",
              "position": { "x": 540, "y": 960 },
              "animations": [
                {
                  "type": "fadeInUp",
                  "duration": 0.8,
                  "delay": 0.2
                }
              ]
            }
          ]
        }
      ]
    },
    "output_format": "mp4"
  }
}

Trả về: URL hoặc đường dẫn file đến file video đã render.


render_image

Tạo một khung hình đơn hoặc hình ảnh tĩnh từ template JSON. Hữu ích để tạo thumbnail, đồ họa mạng xã hội, khung poster và tài liệu marketing tĩnh.

Tham số:

  • template (object, bắt buộc) – Template JSON xác định thành phần hình ảnh.
  • inputs (object, tùy chọn) – Giá trị thay thế biến template.
  • output_format (string, tùy chọn) – Định dạng đầu ra: png, jpeg, hoặc webp. Mặc định là png.
  • frame (number, tùy chọn) – Khung hình nào để render (để trích xuất một khoảnh khắc cụ thể từ template động).

Khi nào sử dụng render_image so với render_video:

  • Sử dụng render_image cho đầu ra tĩnh: thumbnail, banner, bài đăng mạng xã hội, slide thuyết trình.
  • Sử dụng render_video cho bất cứ thứ gì có chuyển động: animation, transition, audio, video clip.

start_render_async

Bắt đầu một công việc render không đồng bộ cho các video có thời lượng dài (thường là trên 30 giây). Thay vì chờ render hoàn thành đồng bộ, công cụ này trả về job ID mà bạn có thể poll với check_render_status.

Tham số:

  • template (object, bắt buộc) – Template JSON hoàn chỉnh.
  • inputs (object, tùy chọn) – Giá trị biến template.
  • output_format (string, tùy chọn) – Định dạng đầu ra mong muốn.

Trả về: Chuỗi job_id có thể được sử dụng với check_render_statuslist_render_jobs.

Khi nào sử dụng async rendering:

  • Video dài hơn 30 giây
  • Template với nhiều scene hoặc animation phức tạp
  • Quy trình rendering hàng loạt nơi bạn muốn gửi nhiều công việc và thu thập kết quả sau
  • Môi trường rendering đám mây nơi các yêu cầu đồng bộ chạy lâu có thể timeout

check_render_status

Kiểm tra trạng thái hiện tại của công việc render không đồng bộ được bắt đầu với start_render_async.

Tham số:

  • job_id (string, bắt buộc) – Job ID được trả về bởi start_render_async.

Trả về: Một object chứa:

  • status – Một trong số queued, rendering, completed, hoặc failed.
  • progress – Phần trăm (0-100) cho biết tiến trình render.
  • output_url – URL của video hoàn thành (chỉ có khi statuscompleted).
  • error – Thông báo lỗi nếu công việc thất bại.

Ví dụ quy trình polling:

Tác nhân AI:
1. start_render_async → job_id: "abc-123"
2. check_render_status("abc-123") → status: "rendering", progress: 35
3. check_render_status("abc-123") → status: "rendering", progress: 78
4. check_render_status("abc-123") → status: "completed", output_url: "https://..."

list_render_jobs

Liệt kê tất cả các công việc rendering không đồng bộ, cả đang hoạt động và đã hoàn thành. Hữu ích để giám sát các hoạt động rendering hàng loạt hoặc xem lại đầu ra gần đây.

Tham số:

  • status_filter (string, tùy chọn) – Lọc theo trạng thái: queued, rendering, completed, failed, hoặc all. Mặc định là all.
  • limit (number, tùy chọn) – Số lượng công việc tối đa để trả về.

Trả về: Một mảng các object công việc, mỗi object có job_id, status, progress, created_at, và output_url (nếu đã hoàn thành).


Công cụ Validation & Discovery

Các công cụ này giúp các tác nhân AI hiểu những gì Rendervid có thể làm và xác minh rằng các template là chính xác trước khi rendering.

validate_template

Xác thực template JSON trước khi rendering. Công cụ này kiểm tra cấu trúc template, loại trường, ràng buộc giá trị và thậm chí xác minh rằng các URL phương tiện (hình ảnh, video, file âm thanh) có thể truy cập được. Chạy xác thực trước khi rendering ngăn ngừa lãng phí thời gian trên các template sẽ thất bại trong quá trình render.

Tham số:

  • template (object, bắt buộc) – Template JSON để xác thực.
  • check_urls (boolean, tùy chọn) – Có xác minh URL phương tiện có thể truy cập hay không. Mặc định là true.

Trả về: Một object chứa:

  • valid – Boolean cho biết liệu template có hợp lệ hay không.
  • errors – Mảng các object lỗi với path, message, và severity cho mỗi vấn đề được tìm thấy.
  • warnings – Mảng các object cảnh báo cho các vấn đề không quan trọng (ví dụ: biến không sử dụng, kích thước rất lớn).

Những gì xác thực bắt được:

  • Trường bắt buộc bị thiếu (ví dụ: một scene không có duration)
  • Loại trường không hợp lệ (ví dụ: một chuỗi nơi một số được mong đợi)
  • Loại layer hoặc animation preset không xác định
  • URL phương tiện bị hỏng hoặc không thể truy cập (hình ảnh, video, file âm thanh)
  • Giá trị ngoài phạm vi (ví dụ: kích thước âm, fps trên mức tối đa)
  • Lỗi cú pháp biến template

Ví dụ phản hồi xác thực:

{
  "valid": false,
  "errors": [
    {
      "path": "scenes[0].layers[2].src",
      "message": "URL returned HTTP 404: https://example.com/missing-image.png",
      "severity": "error"
    },
    {
      "path": "scenes[1].duration",
      "message": "Scene duration must be a positive number",
      "severity": "error"
    }
  ],
  "warnings": [
    {
      "path": "outputSettings.width",
      "message": "Width 7680 is very large and may result in slow rendering",
      "severity": "warning"
    }
  ]
}

get_capabilities

Trả về mô tả toàn diện về mọi thứ Rendervid có thể làm. Đây thường là công cụ đầu tiên mà tác nhân AI gọi khi bắt đầu một tác vụ tạo video. Phản hồi bao gồm các loại layer có sẵn, animation presets, easing functions, filters, output formats và JSON schemas của chúng.

Tham số: Không có.

Trả về: Một object có cấu trúc chứa:

  • layerTypes – Tất cả các loại layer có sẵn (text, image, video, shape, audio, group, lottie, custom) với JSON schemas và các thuộc tính có thể cấu hình của chúng.
  • animations – Tất cả animation presets được nhóm theo danh mục (entrance, exit, emphasis, keyframe) với mô tả và tham số có thể cấu hình.
  • easingFunctions – Tất cả 30+ easing functions với mô tả và ví dụ sử dụng.
  • filters – Các filter hình ảnh có sẵn (blur, brightness, contrast, saturate, grayscale, sepia, v.v.) với phạm vi tham số.
  • outputFormats – Các định dạng đầu ra được hỗ trợ cho rendering video và hình ảnh với các ràng buộc của chúng.
  • inputTypes – Các loại biến template và quy tắc xác thực.
  • sceneTransitions – Tất cả 17 loại chuyển cảnh với các tham số của chúng.

Tại sao công cụ này quan trọng đối với các tác nhân AI:

Phản hồi capabilities là một API tự mô tả. Tác nhân AI không cần được đào tạo trước về định dạng template của Rendervid. Nó có thể gọi get_capabilities tại runtime, nhận schema hoàn chỉnh và tạo các template hợp lệ ngay lần thử đầu tiên. Khi Rendervid thêm các tính năng, animation hoặc loại layer mới, các tác nhân AI tự động có quyền truy cập vào chúng thông qua công cụ này mà không cần thay đổi code.


get_example

Tải một template mẫu cụ thể theo tên. Các tác nhân AI sử dụng điều này để truy xuất một template hoạt động làm điểm khởi đầu, sau đó sửa đổi nó để phù hợp với yêu cầu của người dùng.

Tham số:

  • name (string, bắt buộc) – Tên template mẫu (ví dụ: instagram-story, product-showcase, animated-bar-chart).

Trả về: Template JSON hoàn chỉnh cho ví dụ được yêu cầu, sẵn sàng để render hoặc sửa đổi.

Ví dụ:

Tác nhân AI gọi: get_example("instagram-story")
Trả về: Template câu chuyện Instagram 1080x1920 hoàn chỉnh với các layer text,
         hình ảnh nền và entrance animations

list_examples

Duyệt danh mục đầy đủ của 50+ template mẫu được tổ chức theo danh mục. Các tác nhân AI sử dụng điều này để tìm các template khởi đầu phù hợp cho yêu cầu của người dùng.

Tham số:

  • category (string, tùy chọn) – Lọc theo danh mục (ví dụ: social-media, marketing, data-visualization, typography, e-commerce).

Trả về: Một mảng các object metadata mẫu, mỗi object có:

  • name – Định danh template để sử dụng với get_example.
  • category – Danh mục template.
  • description – Template tạo ra cái gì.
  • dimensions – Chiều rộng và chiều cao đầu ra.
  • duration – Thời lượng template tính bằng giây.

Công cụ Documentation

Các công cụ này cung cấp tài liệu tham khảo chi tiết mà các tác nhân AI có thể tham khảo khi xây dựng template.

get_component_docs

Trả về tài liệu chi tiết cho một component hoặc loại layer cụ thể. Bao gồm mô tả thuộc tính, trường bắt buộc so với tùy chọn, giá trị mặc định và ví dụ sử dụng.

Tham số:

  • component (string, bắt buộc) – Tên component/loại layer (ví dụ: text, image, video, shape, audio, group, lottie, custom, AnimatedLineChart, TypewriterEffect).

Trả về: Tài liệu toàn diện bao gồm:

  • Bảng thuộc tính với các loại, giá trị mặc định và mô tả
  • JSON schema cho component
  • Ví dụ sử dụng
  • Ghi chú về sự khác biệt rendering trình duyệt so với Node.js

get_animation_docs

Trả về tài liệu tham khảo hiệu ứng animation hoàn chỉnh, bao gồm tất cả các entrance, exit, emphasis và keyframe animation presets.

Tham số:

  • animation (string, tùy chọn) – Tên animation cụ thể để lấy tài liệu chi tiết (ví dụ: fadeInUp, bounceIn, slideOutLeft). Nếu bỏ qua, trả về danh mục animation đầy đủ.

Trả về: Tài liệu animation bao gồm:

  • Tên animation và danh mục (entrance, exit, emphasis, keyframe)
  • Mô tả hiệu ứng hình ảnh
  • Tham số có thể cấu hình (duration, delay, easing)
  • Giá trị mặc định
  • Các trường hợp sử dụng được đề xuất

get_component_defaults

Trả về các giá trị mặc định và JSON schema đầy đủ cho một loại component cụ thể. Các tác nhân AI sử dụng điều này để hiểu một component hợp lệ tối thiểu trông như thế nào và những thuộc tính nào họ có thể ghi đè.

Tham số:

  • component (string, bắt buộc) – Tên component/loại layer.

Trả về: Một object JSON với:

  • defaults – Giá trị mặc định hoàn chỉnh cho mọi thuộc tính
  • schema – JSON Schema xác định cấu trúc, loại và ràng buộc của component
  • required – Danh sách các thuộc tính bắt buộc

Ví dụ phản hồi cho text layer:

{
  "defaults": {
    "type": "text",
    "text": "",
    "fontSize": 24,
    "fontFamily": "Arial",
    "color": "#000000",
    "fontWeight": "normal",
    "textAlign": "center",
    "position": { "x": 0, "y": 0 },
    "opacity": 1,
    "rotation": 0,
    "animations": []
  },
  "required": ["type", "text"],
  "schema": {
    "type": "object",
    "properties": {
      "text": { "type": "string", "description": "The text content to display" },
      "fontSize": { "type": "number", "minimum": 1, "maximum": 500 },
      "fontFamily": { "type": "string", "description": "Google Font name or system font" },
      "color": { "type": "string", "pattern": "^#[0-9a-fA-F]{6}$" }
    }
  }
}

get_easing_docs

Trả về tài liệu tham khảo hoàn chỉnh cho tất cả các easing functions có sẵn. Easing functions kiểm soát đường cong tăng tốc của animation, xác định xem chúng bắt đầu chậm, kết thúc chậm, nảy hoặc theo đường cong đàn hồi.

Tham số:

  • easing (string, tùy chọn) – Tên easing function cụ thể để lấy tài liệu chi tiết. Nếu bỏ qua, trả về danh sách đầy đủ.

Trả về: Tài liệu cho mỗi easing function bao gồm:

  • Tên function (ví dụ: easeInOutCubic, easeOutBounce, spring)
  • Mô tả toán học của đường cong
  • Mô tả trực quan về cảm giác chuyển động
  • Các trường hợp sử dụng được đề xuất
  • Tương đương CSS (nếu có)

Thiết lập Tích hợp AI

Kết nối Rendervid với công cụ AI của bạn yêu cầu thêm máy chủ MCP vào cấu hình công cụ của bạn. Quá trình thiết lập thay đổi một chút giữa các công cụ, nhưng khái niệm cốt lõi là giống nhau: chỉ công cụ AI của bạn đến điểm vào máy chủ MCP của Rendervid.

Yêu cầu trước

Trước khi cấu hình bất kỳ công cụ AI nào, hãy đảm bảo bạn có:

  1. Node.js 18+ được cài đặt trên hệ thống của bạn
  2. Rendervid được clone và build từ kho GitHub :
git clone https://github.com/AceDZN/rendervid.git
cd rendervid
npm install
cd mcp
npm install
npm run build
  1. FFmpeg được cài đặt (bắt buộc cho đầu ra video):
# macOS
brew install ffmpeg

# Ubuntu/Debian
sudo apt install ffmpeg

# Windows (với Chocolatey)
choco install ffmpeg

Claude Desktop / Claude Code

Thêm máy chủ MCP Rendervid vào file cấu hình Claude Desktop của bạn.

Vị trí file cấu hình:

  • macOS: ~/Library/Application Support/Claude/claude_desktop_config.json
  • Windows: %APPDATA%\Claude\claude_desktop_config.json
  • Linux: ~/.config/Claude/claude_desktop_config.json

Cấu hình:

{
  "mcpServers": {
    "rendervid": {
      "command": "node",
      "args": ["/path/to/rendervid/mcp/build/index.js"],
      "env": {}
    }
  }
}

Thay thế /path/to/rendervid bằng đường dẫn thực tế đến cài đặt Rendervid của bạn.

Đối với Claude Code (CLI), thêm cùng cấu hình vào file .claude/mcp.json của dự án hoặc cài đặt Claude Code toàn cục của bạn. Claude Code sẽ tự động phát hiện máy chủ MCP và cung cấp tất cả 11 công cụ trong các phiên coding của bạn.

Sau khi lưu cấu hình, khởi động lại Claude Desktop hoặc Claude Code. Bạn có thể xác minh kết nối bằng cách hỏi Claude: “What Rendervid tools are available?” Claude sẽ liệt kê tất cả 11 công cụ MCP.

Cursor IDE

Thêm máy chủ MCP Rendervid vào cấu hình MCP của Cursor.

File cấu hình: .cursor/mcp.json trong thư mục gốc dự án của bạn (hoặc cài đặt Cursor toàn cục).

{
  "mcpServers": {
    "rendervid": {
      "command": "node",
      "args": ["/path/to/rendervid/mcp/build/index.js"]
    }
  }
}

Sau khi lưu, khởi động lại Cursor. Các công cụ Rendervid sẽ có sẵn trong trợ lý AI của Cursor, cho phép bạn tạo video trực tiếp từ editor của mình.

Windsurf IDE

Windsurf hỗ trợ các máy chủ MCP thông qua cấu hình AI của nó. Thêm máy chủ Rendervid vào cài đặt MCP Windsurf của bạn:

{
  "mcpServers": {
    "rendervid": {
      "command": "node",
      "args": ["/path/to/rendervid/mcp/build/index.js"]
    }
  }
}

Tham khảo tài liệu của Windsurf để biết vị trí file cấu hình chính xác, vì nó có thể thay đổi theo phiên bản và hệ điều hành.

Thiết lập MCP chung

Bất kỳ công cụ nào triển khai đặc tả client MCP đều có thể kết nối với máy chủ MCP của Rendervid. Máy chủ giao tiếp qua stdio (standard input/output), đây là transport MCP mặc định.

Để tích hợp với client MCP tùy chỉnh:

  1. Spawn process máy chủ MCP:
    node /path/to/rendervid/mcp/build/index.js
    
  2. Giao tiếp qua stdin/stdout sử dụng giao thức MCP JSON-RPC.
  3. Gọi tools/list để khám phá các công cụ có sẵn.
  4. Gọi tools/call với tên công cụ và đối số để thực thi bất kỳ công cụ nào.

Máy chủ MCP là stateless. Mỗi lần gọi công cụ là độc lập và máy chủ có thể xử lý các yêu cầu đồng thời từ nhiều client.


Quy trình AI: Ví dụ từ đầu đến cuối

Các ví dụ sau đây cho thấy cách các tác nhân AI sử dụng các công cụ MCP của Rendervid để đi từ lời nhắc ngôn ngữ tự nhiên đến video hoàn chỉnh.

Ví dụ 1: Tạo Nội dung Mạng xã hội

Lời nhắc người dùng: “Create a 10-second Instagram story promoting a summer sale with animated text and a gradient background”

Quy trình tác nhân AI:

Bước 1 – Khám phá capabilities:

Tác nhân gọi get_capabilities để tìm hiểu về các loại layer có sẵn, animation presets và ràng buộc đầu ra. Nó phát hiện rằng các layer textshape có sẵn, các animation fadeInUpscaleIn tồn tại, và các câu chuyện Instagram sử dụng độ phân giải 1080x1920.

Bước 2 – Tìm template khởi đầu:

Tác nhân gọi list_examples với category: "social-media" và tìm thấy template instagram-story. Sau đó nó gọi get_example("instagram-story") để tải template JSON đầy đủ.

Bước 3 – Xây dựng template:

Sử dụng ví dụ làm tham chiếu, tác nhân xây dựng một template tùy chỉnh:

{
  "outputSettings": {
    "width": 1080,
    "height": 1920,
    "fps": 30,
    "duration": 10
  },
  "scenes": [
    {
      "duration": 10,
      "layers": [
        {
          "type": "shape",
          "shapeType": "rectangle",
          "width": 1080,
          "height": 1920,
          "gradient": {
            "type": "linear",
            "angle": 135,
            "stops": [
              { "color": "#FF6B35", "position": 0 },
              { "color": "#F72585", "position": 0.5 },
              { "color": "#7209B7", "position": 1 }
            ]
          }
        },
        {
          "type": "text",
          "text": "SUMMER SALE",
          "fontSize": 96,
          "fontFamily": "Montserrat",
          "fontWeight": "bold",
          "color": "#FFFFFF",
          "position": { "x": 540, "y": 700 },
          "animations": [
            { "type": "fadeInUp", "duration": 0.8, "delay": 0.3 }
          ]
        },
        {
          "type": "text",
          "text": "50% OFF EVERYTHING",
          "fontSize": 64,
          "fontFamily": "Montserrat",
          "color": "#FFE066",
          "position": { "x": 540, "y": 850 },
          "animations": [
            { "type": "fadeInUp", "duration": 0.8, "delay": 0.6 }
          ]
        },
        {
          "type": "text",
          "text": "Shop Now  →",
          "fontSize": 48,
          "fontFamily": "Montserrat",
          "color": "#FFFFFF",
          "position": { "x": 540, "y": 1200 },
          "animations": [
            { "type": "scaleIn", "duration": 0.6, "delay": 1.2 }
          ]
        }
      ]
    }
  ]
}

Bước 4 – Xác thực:

Tác nhân gọi validate_template với template JSON. Phản hồi trả về là valid: true không có lỗi.

Bước 5 – Render:

Tác nhân gọi render_video với template đã xác thực và nhận URL đến file MP4 hoàn chỉnh.


Ví dụ 2: Tự động hóa Video Marketing

Lời nhắc người dùng: “Generate a product showcase video for our new headphones. Use this product image: https://example.com/headphones.png . The product name is ‘SoundPro X1’ and the price is $299.”

Quy trình tác nhân AI:

  1. get_capabilities – Tìm hiểu về các layer hình ảnh, kiểu text và tùy chọn animation.
  2. list_examples – Tìm template product-showcase trong danh mục e-commerce.
  3. get_example("product-showcase") – Tải template giới thiệu sản phẩm hoàn chỉnh, sử dụng biến template cho tên sản phẩm, hình ảnh và giá.
  4. Sửa đổi template – Cập nhật inputs với dữ liệu sản phẩm của người dùng:
    {
      "inputs": {
        "productName": "SoundPro X1",
        "productImage": "https://example.com/headphones.png",
        "price": "$299",
        "tagline": "Premium Sound, Redefined"
      }
    }
    
  5. validate_template – Xác minh template và xác nhận rằng https://example.com/headphones.png có thể truy cập được.
  6. render_video – Tạo video giới thiệu sản phẩm cuối cùng.

Quy trình này thể hiện cách các tác nhân AI tận dụng các biến template để tạo nội dung được cá nhân hóa từ các template có thể tái sử dụng. Cùng một template giới thiệu sản phẩm có thể tạo hàng trăm video độc đáo bằng cách hoán đổi các inputs.


Ví dụ 3: Tạo Trực quan hóa Dữ liệu

Lời nhắc người dùng: “Create an animated bar chart showing quarterly revenue: Q1: $1.2M, Q2: $1.8M, Q3: $2.1M, Q4: $2.7M”

Quy trình tác nhân AI:

  1. get_capabilities – Phát hiện loại layer customcomponent tích hợp sẵn AnimatedLineChart.
  2. get_component_docs("AnimatedLineChart") – Đọc tài liệu cho component biểu đồ, tìm hiểu về định dạng dữ liệu, cấu hình màu sắc, nhãn trục và tùy chọn animation.
  3. get_component_defaults("AnimatedLineChart") – Lấy các giá trị mặc định và JSON schema để hiểu cấu hình tối thiểu yêu cầu.
  4. Xây dựng template với layer component tùy chỉnh:
    {
      "type": "custom",
      "component": "AnimatedLineChart",
      "props": {
        "data": [
          { "label": "Q1", "value": 1200000 },
          { "label": "Q2", "value": 1800000 },
          { "label": "Q3", "value": 2100000 },
          { "label": "Q4", "value": 2700000 }
        ],
        "colors": ["#4361EE", "#3A0CA3", "#7209B7", "#F72585"],
        "title": "Quarterly Revenue 2025",
        "yAxisLabel": "Revenue (USD)",
        "animationDuration": 2
      }
    }
    
  5. validate_template – Xác nhận cấu trúc template là chính xác.
  6. render_video – Tạo video biểu đồ động.

API Tự mô tả: Cách Capabilities làm cho Tác nhân AI hiệu quả

Công cụ get_capabilities là nền tảng của tích hợp AI của Rendervid. Nó triển khai mô hình API tự mô tả, nơi hệ thống cho các tác nhân AI biết chính xác những gì nó có thể làm, những tham số nào được yêu cầu và những giá trị nào là hợp lệ. Điều này loại bỏ nhu cầu cho các mô hình AI phải ghi nhớ hoặc được đào tạo về API cụ thể của Rendervid.

Phản hồi Capabilities chứa gì

Khi tác nhân AI gọi get_capabilities, nó nhận được phản hồi có cấu trúc bao gồm mọi khía cạnh của hệ thống rendering:

Loại Layer với JSON Schemas:

{
  "layerTypes": {
    "text": {
      "description": "Renders text with full styling control",
      "schema": {
        "properties": {
          "text": { "type": "string", "required": true },
          "fontSize": { "type": "number", "default": 24, "min": 1, "max": 500 },
          "fontFamily": { "type": "string", "default": "Arial" },
          "color": { "type": "string", "format": "hex-color" },
          "position": { "type": "object", "properties": { "x": {}, "y": {} } },
          "animations": { "type": "array", "items": { "$ref": "#/animations" } }
        }
      }
    },
    "image": { "..." : "..." },
    "video": { "..." : "..." },
    "shape": { "..." : "..." },
    "audio": { "..." : "..." },
    "group": { "..." : "..." },
    "lottie": { "..." : "..." },
    "custom": { "..." : "..." }
  }
}

Animation Presets:

Phản hồi capabilities liệt kê mọi animation preset với danh mục, tham số có thể cấu hình và mô tả của nó. Tác nhân AI nhận được dữ liệu này biết rằng fadeInUp là một entrance animation với các tham số duration, delayeasing, và nó di chuyển element lên trên trong khi làm mờ nó vào.

Easing Functions:

Tất cả 30+ easing functions được liệt kê với mô tả, vì vậy tác nhân AI có thể chọn đường cong phù hợp cho mỗi animation. Ví dụ, easeOutBounce được mô tả là mô phỏng hiệu ứng nảy ở cuối animation, mà tác nhân có thể đề xuất cho nội dung vui tươi hoặc thu hút sự chú ý.

Filters và Effects:

Các filter hình ảnh như blur, brightness, contrast, saturate, grayscalesepia được ghi lại với phạm vi tham số của chúng, cho phép tác nhân AI áp dụng hiệu ứng hậu kỳ cho bất kỳ layer nào.

Tại sao API Tự mô tả quan trọng

Các API truyền thống yêu cầu tài liệu mà các mô hình AI có thể hoặc không nhìn thấy trong quá trình đào tạo. Một API tự mô tả cung cấp tài liệu tại runtime, đảm bảo tác nhân AI luôn có thông tin hiện tại, chính xác. Khi Rendervid thêm animation preset hoặc loại layer mới, mọi tác nhân AI được kết nối ngay lập tức nhìn thấy nó thông qua get_capabilities. Không cần cập nhật tài liệu, không cần đào tạo lại, không có sự không khớp phiên bản.


Thực hành Tốt nhất cho Tạo Video AI

Tuân theo các hướng dẫn này để có kết quả tốt nhất khi sử dụng các tác nhân AI để tạo video Rendervid.

1. Luôn Xác thực trước khi Render

Gọi validate_template trước mỗi lần render. Rendering tốn kém về mặt tính toán, và xác thực gần như tức thì. Công cụ xác thực bắt các vấn đề sẽ khiến render thất bại hoặc tạo ra đầu ra không mong đợi:

  • URL phương tiện bị hỏng (hình ảnh, video, file âm thanh trả về 404)
  • Cấu trúc JSON không hợp lệ hoặc thiếu trường bắt buộc
  • Giá trị ngoài phạm vi cho kích thước, kích thước font hoặc thời lượng
  • Animation presets hoặc loại layer không xác định

Một quy trình AI điển hình phải luôn bao gồm xác thực như một bước trước khi gọi render_video hoặc render_image.

2. Bắt đầu từ Ví dụ

Thay vì xây dựng template từ đầu, các tác nhân AI nên sử dụng list_examplesget_example để tìm template khởi đầu phù hợp. Các template mẫu được kiểm tra và biết là tạo ra đầu ra tốt. Bắt đầu từ một ví dụ và sửa đổi nó nhanh hơn và ít lỗi hơn so với việc tạo cấu trúc template hoàn toàn mới.

Cách tiếp cận được đề xuất:

  1. Gọi list_examples với danh mục liên quan
  2. Gọi get_example cho template khớp gần nhất
  3. Sửa đổi template để phù hợp với yêu cầu cụ thể của người dùng
  4. Xác thực và render

3. Sử dụng Lời nhắc Mô tả

Khi yêu cầu video từ tác nhân AI, hãy cụ thể về:

  • Kích thước và nền tảng – “1080x1920 Instagram story” tốt hơn “a vertical video”
  • Thời lượng – “10-second intro” tốt hơn “a short video”
  • Phong cách và tâm trạng – “dark background with neon text and bouncing animations” cung cấp cho tác nhân AI hướng rõ ràng
  • Cấu trúc nội dung – “Three text lines appearing one after another with fade-in animations” có thể thực hiện hơn “some animated text”

4. Lặp lại trên Template

Tạo video là lặp đi lặp lại. Sau lần render đầu tiên, xem lại đầu ra và yêu cầu tác nhân AI điều chỉnh các element cụ thể:

  • “Make the title text larger and change the color to gold”
  • “Slow down the entrance animations and add a 0.5-second delay between each line”
  • “Add a subtle blur filter to the background image”
  • “Change the easing from linear to easeOutCubic for smoother motion”

Tác nhân AI có thể sửa đổi template hiện có và render lại mà không cần bắt đầu lại, làm cho việc lặp lại nhanh chóng và hiệu quả.

5. Tận dụng Biến Template cho Sản xuất Hàng loạt

Nếu bạn cần nhiều biến thể của cùng một video (sản phẩm khác nhau, ngôn ngữ khác nhau, dữ liệu khác nhau), hãy yêu cầu tác nhân AI tạo template với biến . Điều này cho phép bạn render nhiều video từ một template duy nhất bằng cách truyền các inputs khác nhau:

{
  "inputs": {
    "productName": "Running Shoes Pro",
    "productImage": "https://example.com/shoes.png",
    "price": "$149",
    "tagline": "Run Faster, Go Further"
  }
}

6. Sử dụng Async Rendering cho Video dài

Đối với các video dài hơn 30 giây hoặc template với animation phức tạp, sử dụng start_render_async thay vì render_video. Điều này ngăn ngừa timeout và cho phép tác nhân AI thực hiện các tác vụ khác trong khi video render ở chế độ nền.


Khám phá Template: Duyệt 100+ Ví dụ

Rendervid bao gồm hơn 100 template mẫu trải rộng 32 danh mục, cung cấp cho các tác nhân AI một thư viện phong phú các điểm khởi đầu cho bất kỳ tác vụ tạo video nào.

Cách Tác nhân AI Khám phá Template

Quy trình khám phá template sử dụng hai công cụ theo trình tự:

  1. list_examples – Duyệt danh mục với lọc danh mục tùy chọn để tìm các template liên quan.
  2. get_example – Tải template JSON đầy đủ cho một ví dụ cụ thể.

Danh mục Template

Các tác nhân AI có thể lọc các ví dụ theo danh mục để nhanh chóng tìm các điểm khởi đầu phù hợp:

Danh mụcMô tảTemplate Mẫu
social-mediaNội dung tối ưu hóa nền tảngCâu chuyện Instagram, video TikTok, thumbnail YouTube
e-commerceNội dung sản phẩm và bán hàngGiới thiệu sản phẩm, flash sale, so sánh giá
marketingTài liệu quảng cáoGiới thiệu thương hiệu, lời chứng thực, nổi bật tính năng
data-visualizationBiểu đồ và infographicsBiểu đồ cột, biểu đồ đường, biểu đồ tròn, dashboard
typographyThiết kế tập trung vào văn bảnVăn bản động, thẻ trích dẫn, chuỗi tiêu đề
educationTài liệu học tậpVideo giải thích, hướng dẫn từng bước, sơ đồ
presentationNội dung kiểu slideSlide pitch deck, giới thiệu hội nghị, keynote
abstractHiệu ứng hình ảnh và nghệ thuậtHệ thống hạt, trực quan hóa sóng, gradient

Khám phá Template trong Thực tế

Khi người dùng yêu cầu “an animated chart showing sales data,” tác nhân AI:

  1. Gọi list_examples(category: "data-visualization") và nhận danh sách các template liên quan đến biểu đồ.
  2. Xác định animated-bar-chart là khớp tốt nhất dựa trên mô tả.
  3. Gọi get_example("animated-bar-chart") để tải template hoàn chỉnh.
  4. Kiểm tra cấu trúc template để hiểu cách dữ liệu được định dạng.
  5. Thay thế dữ liệu mẫu bằng số liệu bán hàng thực tế của người dùng.
  6. Xác thực và render.

Cách tiếp cận khám phá trước này có nghĩa là các tác nhân AI luôn tạo ra các template có cấu trúc tốt vì họ đang xây dựng trên các ví dụ đã được kiểm tra thay vì tạo template JSON từ đầu.

Khám phá Tất cả Template có sẵn

Để xem mọi template có sẵn, tác nhân AI có thể gọi list_examples mà không có bộ lọc danh mục. Phản hồi bao gồm metadata cho tất cả 100+ template, cho phép tác nhân tìm kiếm trên các danh mục để tìm kết quả khớp tốt nhất. Mỗi mục bao gồm tên template, danh mục, mô tả, kích thước và thời lượng, cung cấp cho tác nhân đủ thông tin để đưa ra lựa chọn sáng suốt.


Công cụ AI được Hỗ trợ

Máy chủ MCP của Rendervid hoạt động với bất kỳ công cụ nào triển khai đặc tả client Model Context Protocol. Các công cụ sau đây đã được kiểm tra và xác nhận hoạt động với Rendervid:

Công cụ AILoạiHỗ trợ MCPFile Cấu hình
Claude DesktopỨng dụng DesktopNativeclaude_desktop_config.json
Claude CodeCLINative.claude/mcp.json
CursorIDENative.cursor/mcp.json
WindsurfIDENativeCài đặt MCP
Google AntigraviteCloud IDENativeCài đặt MCP

Bởi vì MCP là một tiêu chuẩn mở, bất kỳ công cụ tương lai nào thêm hỗ trợ client MCP sẽ tự động tương thích với máy chủ MCP của Rendervid. Không cần thay đổi máy chủ hoặc các công cụ của nó.


Các Bước Tiếp theo

  • Tổng quan Rendervid – Tìm hiểu về tất cả các tính năng Rendervid, định dạng đầu ra và kiến trúc.
  • Hệ thống Template – Tìm hiểu sâu về cấu trúc template JSON, biến và hệ thống input.
  • Tài liệu tham khảo Components – Tài liệu cho tất cả các loại layer và component React tùy chỉnh.
  • Hướng dẫn Triển khai – Triển khai Rendervid lên AWS Lambda, Azure Functions, Google Cloud Run hoặc Docker để rendering quy mô đám mây.
  • Kho GitHub – Mã nguồn, theo dõi vấn đề và đóng góp cộng đồng.

Câu hỏi thường gặp

Hãy để chúng tôi xây dựng Đội ngũ AI riêng cho bạn

Chúng tôi giúp các công ty như của bạn phát triển chatbot thông minh, Máy chủ MCP, công cụ AI hoặc các loại tự động hóa AI khác để thay thế con người trong các tác vụ lặp đi lặp lại trong tổ chức của bạn.

Tìm hiểu thêm

Hướng Dẫn Toàn Diện Về Ứng Dụng Sora-2: Tạo Video AI Thế Hệ Mới
Hướng Dẫn Toàn Diện Về Ứng Dụng Sora-2: Tạo Video AI Thế Hệ Mới

Hướng Dẫn Toàn Diện Về Ứng Dụng Sora-2: Tạo Video AI Thế Hệ Mới

Khám phá tất cả về ứng dụng Sora-2—tính năng, trường hợp sử dụng và so sánh với các trình tạo video AI hàng đầu. Tìm hiểu cách bắt đầu và tối đa hóa tiềm năng s...

6 phút đọc
ai video ai content +1
json2video-mcp
json2video-mcp

json2video-mcp

Tích hợp FlowHunt với máy chủ json2video-mcp để tự động hóa việc tạo video lập trình, quản lý mẫu tùy chỉnh và kết nối quy trình video với agent, LLM và các côn...

6 phút đọc
AI Video Automation +3