🧠 概要:
概要
この記事は、Pythonを利用したデータ分析に関する学習メモであり、著者がProgateでの学習を卒業し、今後のデータ分析学習に向けた準備や問題点を記録しています。特に、サンプルデータのダウンロードやファイル管理に関する苦労、エラーの解決方法について述べています。
要約の箇条書き
- ProgateでPythonを2周、データ分析を1周した後、卒業を決意。
- データ分析の目的は、経理としての財務分析に役立てるため。
- Windows 11でzipファイルが自動解凍されることを知らず、データのアップロードで苦戦。
- 同じファイル名の重複やネストされたフォルダが原因でエラーが発生。
- ChatGPTを使ってエラーの原因を特定し改善。
- 次回はデータの読み込みに進む予定で楽しみを感じている。
データ分析をやる目的は、現在経理として財務分析をするように求められているためです。元々興味のあったプログラミングで何か出来ないかと思って勉強しています。(2か月目)
(正直経理に飽きています(笑))
サンプルのダウンロード
まずサンプルのダウンロードから手こずりました(笑)windows11は10と違ってデータの解凍が自動で行われるのを知らず、
ずっとzipファイルをgoogle colabratoryにアップロード出来なくて苦戦しました。zipファイルを右クリック⇒すべて展開で解凍可能でした。
保存データの場所が参考書と異なり動かない
google colabratoryにサンプルをダウンロードに手こずったせいで、未解凍のデータを何度もダウンロードしていました。
そのため同じ名前のファイルがいくつかあり、同じファイル名の中に もう一つ同じ名前のフォルダが入っている状態になっていました。
そのため参考書通りのデータ保存先と異なり、コードを入力してもエラーになってしまいました。そこでも手こずりました。作業ディレクトリが参考書だと/content/drive/MyDrive/100knock-process-visualization/chapter-1にあるはずなのに、私の場合’/content/drive/MyDrive/100knock-process-visualization/100knock-process-visualization/chapter-1’にありました。
これに気付いたのはChatGPTにエラーコードを貼り付けして原因を和訳してもらったおかげです。
同じ名前のフォルダ(ネストされたフォルダ)が入っている状態か分かったコード
import os
folder_path=”/content/drive/MyDrive/100knock-process-visualization”
if os.path.exists(folder_path):print(“📁 フォルダの中身:”)for item in os.listdir(folder_path):print(“・”, item)else:
print(“❌ 指定フォルダが見つかりません。”)
結果 📁 フォルダの中身: ・ 100knock-process-visualization
これで100knock-process-visualization の中に もう一つ同じ名前のフォルダ(ネストされたフォルダ)が入っている状態と分かりました。
まとめ
まずwindows11は保存先を変更しても自動でzipファイルが解凍されないことを知りました。ファイルを右クリック⇒全て展開で可能。まさかサンプルのデータが同じサンプル名の中に保存されているとは想像していませんでした。何度も同じファイルをダウンロードしたせいだと思います。エラー内容をChatGPTに聞いて正解でした。初歩で躓きすぎて自分でもビックリしています(笑)ChatGPTがなければ私はプログラミング出来なかったでしょう。
次からはやっとデータの読み込みを始めようと思います。楽しみ!
Views: 0