Marscode 刷题实践:BUG与优势 |豆包MarsCode AI刷题

163 阅读2分钟

最近参加训练营吗,使用Marscode刷了题,本来幻想使用它代替力扣多刷几道题,看了题库觉得题也很有意思,结果遇到不少的bug,希望大家可以一起讨论,如何应对以及希望豆包刷题变得越来越好。

值得改进的点

题目难度设置不合理

因为力扣等网站的先入为主,ai刷题的简单难度属实太过唬人了。传统网站上的简单题基本一眼就可以出思路,并且使用简单的遍历就可以得到结果,豆包刷题网站的题目基本都需要BFS和一定的数学思维,好好思考一下才行。或许是字节本身的算法能力就很高,已经不太在意简单题的level?但是当我看到豆包AI面对简单题冥思苦想数十次依旧给出错误答案的时候还是觉得啼笑皆非,不知道该说题目出得好还是AI太笨了。

UI按键不方便

身为一个debug软件,有很多该给的按键并没有很到位。身为一个CV工程师(bushi),甚至连一键复制代码的功能都没有,有点让人汗颜。

image.png

性能不能满足要求

在使用的过程中,豆包并不能给我很好的体验:

  • 基本上直接让他生成代码都不能完美通过所有测试用例
  • 在修改我的代码时常常不知所云
  • 对题目的理解非常有限,我怀疑让他修改代码时并没有加入题目作为上下文
def solution(a: int, b: int) -> int:

    list_num = list(str(a))

    index = 0

    for i, num in enumerate(reversed(list_num)):

        if int(num) > b:

            index = len(list_num) - i - 1

            break

    if index == 0 and int(list_num[0]) <= b:

        return int(''.join([str(b)] + list_num))

    return int(''.join(list_num[:index] + [str(b)] + list_num[index:]))

  


if __name__ == '__main__':

    print(solution(76543, 4))

    print(solution(1, 0) == 10)

    print(solution(44, 5))

    print(solution(666, 6) == 6666)

image.png

网络体验非常差

我真的不知道为何使用ai刷题平台会如此的卡顿。身为一个水硕留学狗,为了用marscode大部分情况还要魔法回国才能连上服务器,并且时不时有断连的可能性。这也间接导致了我不能用豆包和GPT,claude进行横向的对比做算法题目的能力。不过从印象流来说,在项目中claude的代码纠错能力非常强,GPT要弱一点,Marscode稍弱于GPT。

优点

  • 题目很新颖,每次做都有新奇的感觉。