Java核心技术卷II(第8版) – 读书笔记 – 第2章

本章主要介绍Java与XML。

1、XML非常适合表示复杂的、结构化数据。

2、XML与HTML有所差异,XML更严格,如:区分大小写、必须结束标签、属性必须有值。

3、XML以文档头开始,如:
<?xml version="1.0" encoding="utf-8"?>
4、然后包含若干元素和子元素。
<configuration>
<title></title>
...[......]

继续阅读

VPS推荐:VpsYou购买、测试、使用

最近总有朋友让我推荐vps,于是有了这篇博客。

我首推VpsYou,理由如下:

  1. 我一直在用它家的vps(XEN),非常稳定,从未出过任何故障。
  2. 成立于2009年,最早的一批vps服务商,口碑非常好。
  3. 5个机房可以选择,速度很快(见底部《测试篇》)。
  4. 支持支付宝,中文QQ客服,响应迅速。
  5. 比较低调(这个很重要,会极大降低被同行恶意攻击的风险)
  6. 支持7天无条件退款(最便宜的一款55元做左右,XEN)。

有的朋友可能会说:我看过很多20多块钱,甚至月付10块钱的[......]

继续阅读

Xapian实现Simple BM25F

SimpleBM25F是BM25F的基础拓展版本,主要用于多个域的拓展,感兴趣的可以看《Simple BM25 Extension to Multiple Weighted Fields》。

主要观点:按照权重将不同域重复相应次数,拼成无结构的混合文本桶,然后只计算一次BM25得分。

而之前很多人采用的各个域先计算不同的BM25,再线性组合的做法,则破坏了词项独立性而效果很差。

传统:bm25.cpp
#include <xapian.h>
#include &[......]

继续阅读