Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

使用 SPU 实现 AdaBoost 分类器算法 #257

Open
Candicepan opened this issue Jul 21, 2023 · 8 comments
Open

使用 SPU 实现 AdaBoost 分类器算法 #257

Candicepan opened this issue Jul 21, 2023 · 8 comments
Labels
challenge never-stale OSCP SecretFlow Open Source Contribution Plan

Comments

@Candicepan
Copy link
Contributor

Candicepan commented Jul 21, 2023

此 ISSUE 为 隐语开源共建计划(SecretFlow Open Source Contribution Plan,简称 SF OSCP)任务 ISSUE,欢迎社区开发者参与共建~
若有感兴趣想要认领的任务,但还未报名,辛苦先完成报名进行哈~

任务介绍

  • 任务名称:使用 SPU 实现 AdaBoost 分类器算法
  • 技术方向:SPU/SML
  • 任务难度:挑战🌟🌟🌟
  • 任务期望完成时间:8 周

详细要求

  • 安全性(尽量少 reveal)
  • 功能性:实现算法的基本功能,包括:
    • 支持 fit,predict
    • 提供配置学习率,分类器个数等基本参数
    • 支持起码一种弱分类器(如决策树,也可以是其他支持加权训练的分类器)
  • 收敛性:包含 simulator 跑出的实验数据并且证明收敛性/准确性(最好有与明文 sklearn 结果的对比,可详见参考 PR
  • 正确性:请确保提交的代码内容为可以直接运行的
  • 代码规范:Python 代码需要使用 black+isort 进行格式化(流水线包含代码规范检查卡点)
  • 提交说明:
    • 为避免走弯路,请先提交你的设计思路,经确认后再进入开发阶段
      • 设计思路说明:简单说明计划使用什么算法 or 什么优化器实现任务需求即可
    • 关联该 isuue 并提交代码至 https://github.com/secretflow/spu/tree/main/sml
  • 特殊说明:若某个特性有特殊的限制,如需要 FM128,需要更多 fxp 等需要在注释文档中明确说明

能力要求

  • 熟悉经典的机器学习算法
  • 熟悉 JAX 或 NumPy,可以使用 NumPy 实现算法

操作说明

开发须知

以下部分代码请必须增加代码注释,对对应代码模块进行说明,包括:

  • __init__函数的超参数含义
  • fit 的具体算法实现说明
@Candicepan Candicepan added OSCP SecretFlow Open Source Contribution Plan challenge labels Jul 21, 2023
@FanGuojie
Copy link
Contributor

申请实现

@Candicepan
Copy link
Contributor Author

申请实现

感谢申请,辛苦按照格式回复哈~认领回复格式:【GitHub ID + Give it to me】

@FanGuojie
Copy link
Contributor

Fanguojie Give it to me

@Candicepan
Copy link
Contributor Author

申请实现

感谢申请,辛苦按照格式回复哈~认领回复格式:【GitHub ID + Give it to me】

感谢认领~为避免走弯路,请先提交你的设计思路,经确认后再进入开发阶段

  • 设计思路说明:简单说明计划使用什么算法 or 什么优化器实现任务需求即可

@FanGuojie
Copy link
Contributor

基分类器:决策树、逻辑回归、SVC、KNeighborsClassifier、RandomForestClassifier、glm。adaboost本身不涉及优化器

@deadlywing
Copy link
Contributor

基分类器:决策树、逻辑回归、SVC、KNeighborsClassifier、RandomForestClassifier、glm。adaboost本身不涉及优化器

hello,,当前sml中已经有的base model只有LR,建议您可以先把adaboost本身的功能实现,然后再考虑扩展多种base model

Thanks

@Candicepan
Copy link
Contributor Author

基分类器:决策树、逻辑回归、SVC、KNeighborsClassifier、RandomForestClassifier、glm。adaboost本身不涉及优化器

因一直未提交相应 PR ,故该任务回收~

@Yeekin-GYJ
Copy link

该任务与 spu #254spu #258 为「开源之夏 2024」基于 SPU 实现 tree-based 分类算法与分位数回归算法的项目课题,不可单独认领。具体认领方式请遵循「开源之夏 2024」活动规则~详情查看:https://summer-ospp.ac.cn/help/student/

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
challenge never-stale OSCP SecretFlow Open Source Contribution Plan
Projects
Status: Needs Triage
Development

No branches or pull requests

5 participants