はじめに
このチュートリアルの概要
このチュートリアルでは、Webスクレイピングという技術を使い、Web上の記事から中身を自動抽出する方法について学んでいきます。
このチュートリアルの対象受講者
- Web上のデータ収集に時間をかかりすぎていて、「自動でデータ収集してみたいな」と思っている方
- ログインが必要なサイトから、データを取得したいと思っている方
このチュートリアルでできるようになること
このチュートリアルでは、スクレイピング を利用して、以下のことができるようになります。
- ブログ記事を指定して、記事名、更新日、記事のURLを取得できるようになる
- ブログのURLを指定して、そのブログの全記事を取得できるようになる
必須条件
- Pythonの基礎的な文法について理解しておきましょう。(ProgateのPython I ~ Python IV が完了しているレベルを目安に学習を進めましょう。)
- スクレイピングは、HTMLを抽出することになります。HTMLやCSSの基礎を理解しておきましょう。(ProgateのHTML&CSS 中級編が完了しているレベルを目安に学習を進めましょう。)
このチュートリアルのステップ
以下の流れで学習を進めていきます。
- Webスクレイピングでできることを理解する
- 指定したブログ記事から、記事の内容をCSVにしてエクスポートする
- ブログの全記事をスクレイピングしてCSVにエクスポートする
それでは、さっそく進めていきましょう!
ノートをとる
メモが保存されました
メモ一覧を見る