Skip to content

tenk-9/PP_memoryspec_scraping

Repository files navigation

PP_memoryspec_scraping

概要

並列処理の授業において,過去に発売されたメモリの種類とメモリバンド幅を報告する課題のためのスクレイピングプログラム.

情報ソース

  • 価格.comに掲載されているメモリ
  • 1枚で販売されている商品
  • テーブル要素から各種情報を得ている
  • https://kakaku.com/pc/pc-memory/itemlist.aspx?pdf_Spec105=1&pdf_so=e2&pdf_vi=d&pdf_pg={PAGE_INDEX}
    • 2023/10/17現在,ページ数は最大47

情報収集対象の製品

  • 次の表現に一致しないものは無視する.
    • メーカー: (^.*)\u3000
      • 全角空白でメーカー名と製品名が区切られている
    • 製品名: \u3000(.*) [\[\(]
      • 全角空白の後に製品名が記載されている.
      • 製品名の後には半角スペース区切りで,後ろに[または(で始まるスペック文字列が続く.
      • メーカー名がノーブランドの場合,Noneとする.
    • DDRバージョン,バンド幅: .* ?PC([0-9])L?-([0-9]+) ?.*

スクレイピング結果

  • YYYYmmddhh.csv
    • 上記表現に一致するすべての製品csv
  • 2020_2022.csv
    • YYYYmmddhh.csvのうち,発売年が2020年から2022年の間の製品csv

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages