# midscenejs **Repository Path**: carp/midscenejs ## Basic Information - **Project Name**: midscenejs - **Description**: Midscene.js是一个字节跳动开源,由AI驱动的浏览器自动化工具,能够通过自然语言指令来控制网页、执行断言和提取数据。它支持Chrome扩展、JavaScript SDK和YAML脚本,简化了UI测试的编写和维护过程。通过利用多模态大语言模型如GPT-4o,Midscene.js提供了一种全新的自动化开发体验,让用户可以直观地与网页互动并获取结构化的JSON数据。 - **Primary Language**: JavaScript - **License**: MIT - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2025-09-24 - **Last Updated**: 2025-09-24 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README

Midscene.js

Midscene.js

[English](./README.md) | 简体中文

让 AI 成为你的浏览器操作员

npm version huagging face model downloads License discord twitter

Midscene.js 让 AI 成为你的浏览器操作员 🤖。只需用自然语言描述你想做什么,它就能帮你操作网页、验证内容,并提取数据。无论你是想快速体验还是深度开发,都可以轻松上手。如果您在项目中使用了 Midscene.js,可以加入我们的 [社区](https://github.com/web-infra-dev/midscene?tab=readme-ov-file#-community) 来与我们交流和分享。 ## 案例 下面的录制 example 视频基于 [UI-TARS 7B SFT](https://huggingface.co/bytedance-research/UI-TARS-7B-SFT) 模型,视频没有任何加速~ | 指令 | 视频 | | :---: | :---: | | 发布一条 Twitter |