20250709-feed流，读扩散，写扩散？（第76讲）

原文摘要

架构师之路：架构设计中的100个知识点（76）

原文链接

进一步信息揣测

读扩散的隐藏成本：虽然读扩散（拉取模式）节省存储空间，但高并发场景下会导致多次查询和计算，可能引发数据库雪崩，需配合缓存和限流策略，但缓存命中率低时性能急剧下降。
写扩散的取舍内幕：写扩散（推送模式）对明星用户或大V不友好，粉丝量过大时写入延迟飙升，实际应用中常采用“读写混合”策略（如普通用户写扩散，大V读扩散），但混合方案增加系统复杂度。
feed流冷启动陷阱：新用户或低活跃用户的主页推荐常依赖“兜底策略”（如全局热门feed），但过度依赖会导致同质化，需动态加权结合用户潜在兴趣挖掘。
关系链存储的优化黑科技：关系数据（关注/粉丝）通常用图数据库或分片存储，但实际业务中会冗余存储“反向索引”（如粉丝列表+关注列表），牺牲一致性换查询性能。
feed排序的灰色规则：看似按时间排序的feed流，实际掺杂“权重因子”（如付费推广、好友亲密度、历史互动），但权重算法过度调整易引发用户感知不适。
删除feed的连锁反应：删除操作在写扩散系统中需回溯所有粉丝的feed副本，可能触发级联更新，业内常用“软删除+异步清理”降低延迟。
分页查询的深坑：传统LIMIT/OFFSET分页在feed流中效率极低，高性能方案采用“游标分页”（如基于时间戳或自增ID），但游标可能因数据删除导致断层。
数据冷热分离的代价：历史feed迁移到冷存储可降成本，但突发访问（如名人旧帖被挖）可能击穿缓存，需预设热点探测机制。