首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
thewayma123
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
17
文章 16
沸点 1
赞
17
返回
|
搜索文章
赞
文章( 16 )
沸点( 1 )
工作十年,谈谈我的100W QPS高可用架构和系统设计经验
高可用系统设计是每个技术人必须掌握的硬核技能,但很多人只会堆功能,忽视了系统稳定性的重要性。 本文从研发规范、应用服务、存储、产品、运维部署、异常应急六大层面,手把手教你如何设计一个高可用系统,让你的
从零开始构建大型语言模型——实现注意力机制
本章内容: 使用注意力机制的原因 基本的自注意力框架,逐步深入到增强的自注意力机制 允许LLMs逐个生成词元的因果注意力模块 通过dropout随机屏蔽部分注意力权重以减少过拟合 将多个因果注意力模块
浅谈Attention与Self-Attention,一起感受注意力之美
本文已参与「新人创作礼」活动,一起开启掘金创作之路。 浅谈Attention与Self-Attention的前世今生 前言 2017年的某一天,Google 机器翻译团队发表了《Attentio
ollama离线部署qwq模型实操指南
本文介绍使用ollama离线部署qwq模型的方法。涵盖环境准备、模型文件获取、创建Modelfile、模型创建与运行等步骤,以及应用中的问题和优化策略,为离线环境下的模型应用提供指导。
2025大数据常用架构体系
✅ 二、新趋势与推荐组件(按层次) 1. 数据采集层 ✅ Apache Kafka:事实标准,超高吞吐,生态成熟。 🔄 Apache Pulsar:分布式特性好、支持多租户,但生态不如 Kafka 成
揭秘阿里云WAF背后神秘的AI智能防御体系
应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在,也正是这些针对Web应用的安全威胁促使了WAF这个产品的不断发展和进化。同时,各种机器学习算法和模型…
接口被刷百万QPS,怎么防?
大家好,我是苏三,又跟大家见面了。 前言 今天我们不聊风花雪月,只讲这个让无数开发者夜不能寐的终极命题:当恶意流量如海啸般扑来,如何守住你的系统防线? 有些小伙伴在工作中可能经历过接口被刷的噩梦,但百
Rust入门系列:09、万字长文,一次性讲明白Rust中的所有权
所有的程序都必须和计算机内存打交道,如何从内存中申请空间来存放程序的运行内容,如何在不需要的时候释放这些空间,成了重中之重,也是所有编程语言设计的难点之一。
使用 Rust 进行高效能的后端开发:CRUD 服务
或许,应该先定义下 高效能(我心中的): 健壮:程序缺陷和bug少,能够在编译时发现大多数错误。 高性能:API 服务应具备低延迟和高吞吐量的能力,以适应高并发场景。 低资源消耗:在相同吞吐量和响应速
为什么Rust 是 web 开发的理想选择
为什么Rust 是 web 开发的理想选择 Rust 经常被视为仅仅是一种系统编程语言,但实际上它是一种多用途的通用语言。像 Tauri(用于桌面应用)、Leptos(用于前端开发)和 Axum(用于
下一页
关注了
225
关注者
0
收藏集
28
关注标签
15
加入于
2019-09-30