
新一代高性能搜索引擎HA3在
在线零售业务中的应用
邢少敏(多愚)
阿里巴巴高级技术专家
01 在线零售搜索面临的挑战
Contents
目录 02 搜索引擎HA3技术
03 在线零售业务中的搜索实践
在线零售搜索面临的挑战
01
搜索面临的挑战-工程挑战
工程挑战
百万级QPS (高并发) 618、双11等大促活动的高并发访问
千亿级数据(大数据) 商品、订单、物流等海量数据检索
毫秒级时效(高时效) 订单、物流类数据时效性要求极高
5个9可用性(高可用) 分钟级不可用会导致巨额业务损失
毫秒级响应(低延迟) 搜索作为流量入口,延迟高会导致交易量下降
搜索面临的挑战-算法挑战
信息规范程度低
• 宝宝棉服套装婴幼儿冬装0-1岁3男婴儿棉衣秋冬女保暖棉袄加厚外套
• 毛豆新鲜5斤青豆毛豆角甜豆生鲜蔬菜豌豆带壳农家现摘嫩豆荚包邮
意图丰富
• 水 -- (矿泉水?花露水?洗发水?)
• 苹果 -- (吃的苹果?苹果手机?)
• 马可菠萝 -- (菠萝?马可菠萝火腿肠?)
• 丝袜奶茶 -- (丝袜?奶茶?)
召回量大,排序难
• 单次召回千万,如何进行准确排序
搜索引擎HA3技术
02
搜索引擎HA3架构简介
QRS
• 分布式高性能服务
• 实时索引能力 Searcher Searcher
• 插件扩展架构 精排 精排
• SQL查询 粗排 粗排
检索 检索
索引构建
离线处理
业务数据 X 算法数据
可扩展架构支持不同业务规模
SP/TPP
• 多副本
CM2/VIP Server
• 多分片
QRS QRS QRS
CM2
Part0 Part1 Part2