登录
注册
开源
企业版
高校版
搜索
帮助中心
使用条款
关于我们
开源
企业版
高校版
私有云
模力方舟
AI 队友
登录
注册
3月21日 深圳|OpenClaw 线下实战沙龙:招聘、资讯、项目协同三大场景实操,VS ZeroClaw 横向对比评测,别再只会装,来现场跑通真实业务!
代码拉取完成,页面将自动刷新
开源项目
>
工业软件
>
芯片开发
&&
捐赠
捐赠前请先登录
取消
前往登录
扫描微信二维码支付
取消
支付完成
支付提示
将跳转至支付宝完成支付
确定
取消
Watch
不关注
关注所有动态
仅关注版本发行动态
关注但不提醒动态
7
Star
19
Fork
24
MetaX-MACA
/
mcTileLang
代码
Issues
21
Pull Requests
20
Wiki
统计
流水线
服务
JavaDoc
PHPDoc
质量分析
Jenkins for Gitee
腾讯云托管
腾讯云 Serverless
悬镜安全
阿里云 SAE
Codeblitz
SBOM
我知道了,不再自动展开
14
[Dev] Add elementwise ops and doc
开启的
存在冲突
Cael_yu:dev
MetaX-MACA:dev
Cael_yu
创建于 2025-12-09 19:05
克隆/下载
HTTPS
SSH
复制
下载 Email Patch
下载 Diff 文件
# PR Summary: Elementwise Operations Enhancement fix #IDBW2A ## 概述 本 PR 主要包含两部分内容: 1. mcTileLang 与 tilelang 的 elementwise 实现对比分析 2. 新增 6 个常用激活函数算子实现 ## 一、mcTileLang vs tilelang 对比分析 ### 核心差异 通过对比 `example_elementwise_add.py` 的两个版本,发现主要差异在于**内存拷贝策略**: #### mcTileLang 实现 - **直接拷贝模式**:Local Memory → Global Memory - 代码简洁,适用于通用场景 - 在 MACA 等非 Hopper 架构上性能更优 #### tilelang 实现 - **两级拷贝模式**:Local Memory → Shared Memory → Global Memory - 在 Hopper (SM90+) 架构上利用 stmatrix + TMA store 硬件特性 - 需要额外的 shared memory 开销 ## 二、新增激活函数算子 ### 新增算子列表 本 PR 新增了 6 个常用激活函数的 elementwise 实现: | 算子 | 文件 | 公式 | |------|------|------| | ReLU | `example_elementwise_relu.py` | `max(0, x)` | | Sigmoid | `example_elementwise_sigmoid.py` | `1 / (1 + exp(-x))` | | Tanh | `example_elementwise_tanh.py` | `tanh(x)` | | SiLU (Swish) | `example_elementwise_silu.py` | `x * sigmoid(x)` | | LeakyReLU | `example_elementwise_leaky_relu.py` | `max(0, x) + α * min(0, x)` | | GELU | `example_elementwise_gelu.py` | `0.5x(1 + tanh(√(2/π)(x + 0.044715x³)))` |
此 Pull Request 需要贡献者签署贡献者协议后方可合并。
此 Pull Request 需要通过一些审核项
类型
指派人员
状态
审查
ryianyang
进行中
(0/1人)
测试
ryianyang
进行中
(0/1人)
此 Pull Request 无法自动合并
尝试通过 WebIDE 解决冲突
怎样手动合并此 Pull Request
git checkout dev
git pull https://gitee.com/caelyu/mcTileLang.git dev
git push origin dev
评论
0
提交
1
文件
10
检查
代码问题
0
批量操作
展开设置
折叠设置
审查
Code Owner
审查人员
Venti_jing
ventijing
ryianyang
ryianyang
Five-HZ
Five-HZ
未设置
最少人数
1
测试
Venti_jing
ventijing
ryianyang
ryianyang
Five-HZ
Five-HZ
未设置
最少人数
1
优先级
不指定
严重
主要
次要
不重要
标签
未设置
关联 Issue
IDBW2A
[Level 4 示例开发] 【Elementwise 激活函数以及与上游tilelang对比文档】完整使用案例开发
Pull Request 合并后将关闭上述关联 Issue
里程碑
未关联里程碑
合并选项
合并后删除提交分支
提交分支为默认分支,无法删除
合并后关闭提到的 Issue
接受 Pull Request 时使用扁平化(Squash)合并
勾选此选项后,将建议使用 Squash Merge 方式合并以精简提交历史记录
参与者
(1)
1
https://gitee.com/metax-maca/mcTileLang.git
git@gitee.com:metax-maca/mcTileLang.git
metax-maca
mcTileLang
mcTileLang
点此查找更多帮助
搜索帮助
Git 命令在线学习
如何在 Gitee 导入 GitHub 仓库
Git 仓库基础操作
企业版和社区版功能对比
SSH 公钥设置
如何处理代码冲突
仓库体积过大,如何减小?
如何找回被删除的仓库数据
Gitee 产品配额说明
GitHub仓库快速导入Gitee及同步更新
什么是 Release(发行版)
将 PHP 项目自动发布到 packagist.org
评论
仓库举报
回到顶部
登录提示
该操作需登录 Gitee 帐号,请先登录后再操作。
立即登录
没有帐号,去注册