본문 바로가기

Programming4

matplotlib 3차원 데이터 플로팅 코드 [2025-04-22 수정: dataset_make.py 추가] 대학 강의에서 보고서 작성에 활용한 파이썬 코드들입니다. 데이터를 처리하는 과정, 그리고 이를 표현하는 과정이 도움이 될 것 같아 업로드합니다. 왼쪽의 데이터(약 45,000줄) 를 처리하여 오른쪽과 같은 이미지를 얻을 수 있습니다. 2023. 3. 17.
[바코드명으로 사진 자동저장 프로그램] 파이썬 이미지 크롤링 & 자동 저장 (Selenium, Pandas) 상품명/바코드 만 포함된 액셀파일을 받고, 상품명에 적합한 이미지를 찾아, 바코드명으로 저장하는 알바를 하게 되었다. Selenium을 사용해서 부분 자동화 할 수 있을 것 같다. 괄호 안의 작업이 자동화 대상이다. (상품명 구글에서 검색) -> 이미지 선택 -> (바코드명으로 저장) 이런 식으로 구상 중인데, Selenium을 사용해보지 않아서 자신은 없다. 시험 기간에 이런 저런 일들이 겹쳐 바쁜데 할 수 있으려나. 우선 도움될만한 링크와 관련 정보들을 모아두겠다. https://siot0.tistory.com/66 - 파이썬 셀레늄으로 이미지 크롤링 https://teambohemian.tistory.com/8 https://teambohemian.tistory.com/3 ++22-05-19 업데이.. 2022. 5. 18.
파이썬 BeautifulSoup로 블로그 제목만 출력하기 (텍스트 마이닝) 0. BeautifulSoup란? HTML 문서를 분석할 수 있는 파이썬 라이브러리이다. 웹사이트는 HTML이란 언어로 이루어진 문서이고, 웹 브라우저는 이 문서의 뷰어라고 할 수 있다. 1. 설치법 추가 예정 2. 사용법 A) 파이썬 requests 라이브러리의 .get 함수를 이용해 웹사이트에 요청을 보낸다. B) .text 함수를 이용해 웹사이트의 HTML을 추출한다. (string) C) B에서 받아온 소스를 beautifulsoup가 처리할 수 있는 형식으로 변환한다. D) .select 함수를 이용해 필요한 코드를 추출한다. (list) E) .string 함수를 이용해 코드에서 불필요한 태그를 제거한다. 예시) 코드 import requests as re #requests 라이브러리를 re로.. 2021. 11. 6.
파이썬 단어 빈도수 카운트 알고리즘 (자세한 설명) 일정 텍스트 파일에서 단어 중복 횟수, 단어 빈도수를 측정하는 코드이다. try, except를 사용했다. 따로 함수도 있는 것 같은데, 함수로 쉽게 쉽게 하는 건 공부하는 느낌이 안들어서.. 별로 안 좋아한다. 그래서 이 방법을 사용했다. 내가 공부하며 헷갈리는 부분이 많아서 진짜 자세하게 풀어서 설명했다. 단당류 수준으로...! 사실 헷갈릴 부분이 없는 것 같기도 한데, 내가 자료형의 개념이 정확하게 잡혀있지 않아서 헷갈린 것 같다. back to the basic! 코드 fname = "ex.txt" hand = open(fname, 'r') stc = hand.read() wds = stc.split() dic = dict() for wd in wds: try: dic[wd] = dic[wd] +.. 2021. 11. 3.