本章的内容是:国际化!
1、Java默认的UTF-8编码为国际化提供了可能。国际化不止是编码、文本,还包括日期、货币等方面。
2、Locale类表示一个地区(的国际化情况),它包括:一种语言、一个位置和一个变量。
如美国:language=English, location=United States
如果只指定了语言,有时候将无法处理货币、时间等。因为语言可能被多个公家共用,但各地的时间、货币表示符号又不同。
3、Java对于语言使用ISO标准的ISO-639-1[......]
本章的内容是:国际化!
1、Java默认的UTF-8编码为国际化提供了可能。国际化不止是编码、文本,还包括日期、货币等方面。
2、Locale类表示一个地区(的国际化情况),它包括:一种语言、一个位置和一个变量。
如美国:language=English, location=United States
如果只指定了语言,有时候将无法处理货币、时间等。因为语言可能被多个公家共用,但各地的时间、货币表示符号又不同。
3、Java对于语言使用ISO标准的ISO-639-1[......]
1、继承(inheritance):利用已存在的类构造一个新类,复用前者的方法和域。
2、反射(reflection):程序运行期间发现更多的类及其属性的能力。
3、继承:is-a关系。
public class Manager extends Emplyoee
{
//......
public void setBounds(double b)
{
this.bouns = b;
}
private double bouns;
}[......]
Ranking with Indexes
本章内容:索引结构
1、每个系统都需要对应的数据结构(data structures)。信息检索中最常用的数据结构是:倒排索引(inverted index)。
2、本章的另外一个主题是:查询处理(Query processing),即如何让查询使用索引的数据。
3、抽象检索模型:
(1)一篇文档被转化为对应的词项(index terms),形成不同的特征(features)
(2)主题特征(topical features)[......]
这一章主要是走开发Map/Reduce流程,另外介绍Hadoop的配置。
1、配置类org.apache.hadoop.conf.Configuration
属性名是String,Value是boolean、int、long、float、String、Class、File等。
2、上面提到的Configuration是从如下的xml配置文件中读出来的。
注意格式!
<?xml version="1.0"?>
<configuration>
<p[......]