|
|
授業のテーマ
|
授業の内容(90分授業=2時間)
|
事前/事後学修の内容
|
|
|
1
|
人文情報学とはどのような分野なのか?
|
1-1. 「情報学」とはどのような分野なのか? 1-2. 従来の「人文学」研究はどのようなものか 1-3. 人文学と情報学を掛け合わせることの意義 1-4. 人文情報学で行われている研究やその成果:公開されているデータベースの紹介
|
授業内容の復習,まとめ
|
|
2
|
データベースとアノテーション
|
2-1. 1-4で紹介したデータベースを実際に利用する。 2-2. アノテーション,メタデータについて
|
授業内容の復習,まとめ
|
|
3
|
テクスト分析演習 1(オンラインツール)
|
3-1. 既存のオンラインツールを使ったテクスト分析 3-2. テクスト分析でよく使われる用語や指標(述べ語数,異なり語数,ドキュメントの長さ,語彙密度,平均文長,読み易さの指標,特徴語,n-gram,共起等)
|
授業で扱った手技の復習,結果のまとめ
|
|
4
|
テクスト分析演習 2(前処理)
|
4-1. 分析対象を電子データ化する。(英語データ) 4-2. 分析対象を電子データ化する。(日本語データ) 4-3. 正規表現
|
授業で扱った手技の復習,結果のまとめ
|
|
5
|
テクスト分析演習 3(前処理)
|
5-1. 分かち書き・形態素解析 (日本語データ) 5-2. ステミング(レマ化)(英語・日本語データ)
|
授業で扱った手技の復習,結果のまとめ
|
|
6
|
テクスト分析演習 4 (前処理)
|
6-1. 品詞タグとはなにか 6-2. 品詞タグ付け(英語・日本語データ)
|
授業で扱った手技の復習,結果のまとめ
|
|
7
|
テクスト分析演習 5 (頻度)
|
7-1. 既存の大規模コーパスで頻度を調べる 7-2. 素頻度と相対頻度
|
授業で扱った手技の復習,結果のまとめ
|
|
8
|
テクスト分析演習 6 (頻度)
|
8-1. ジャンル(レジスター)間の比較: マン・ホイットニーのU検定,対数尤度比,MI-Score
|
授業で扱った手技の復習,結果のまとめ
|
|
9
|
テクスト分析演習 7(頻度)
|
9-1. 頻度表を作成(英語・日本語) 9-2.作成した頻度表を考察する(記号の扱い,機能語と内容語,ストップワード)
|
授業で扱った手技の復習,結果のまとめ
|
|
10
|
テクスト分析演習 8 (キーワード等)
|
10-1. ワードクラウド 10-2. 共起ネットワーク 10-3. TF-IDF
|
授業で扱った手技の復習,結果のまとめ
|
|
11
|
テクスト分析演習 8 (機械学習)
|
11-1. 階層的クラスタリングについて 11-2. 階層的クラスタリング実践 11-3. 階層的クラスタリング結果の考察
|
授業で扱った手技の復習,結果のまとめ
|
|
12
|
テクスト分析演習 9 (機械学習)
|
12-1. コレスポンデンス分析 12-2. コレスポンデンス分析実践 12-3. コレスポンデンス分析結果の考察
|
授業で扱った手技の復習,結果のまとめ
|
|
13
|
テクスト分析演習 10 (機械学習)
|
13-1. トピックモデル 13-2. トピックモデル実践 13-3. トピックモデル結果の考察
|
授業で扱った手技の復習,結果のまとめ
|
|
14
|
テクスト分析演習 11 (LLM)
|
14-1. LLMを使ったテクスト生成 14-2. LLMを使ったテクスト分析
|
授業で扱った手技の復習,結果のまとめ
|
|
15
|
まとめ
|
15-1. 人文情報学と従来の人文学の融合
|
授業内容の復習,まとめ
|