일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 호이스팅
- 리눅스
- analytics4
- pandas
- isNotEmpty
- oracle
- DBMS
- pem
- Linux
- 오블완
- docker
- mssql
- iBatis
- mysql
- 티스토리챌린지
- MongoDB
- git
- github
- java
- isempty
- Kibana
- 명령어
- PostgreSQL
- spring
- 자바
- Python
- IntelliJ
- SQL
- Javascript
- MariaDB
- Today
- Total
목록Python (7)
hanker

데이터를 다룰 때 중복된 행이 존재하면 분석의 정확성이 떨어진다.pandas에서는 drop_duplicates() 메서드를 사용하여 손쉽게 중복 데이터를 제거할 수 있다. 이번 글에서는 drop_duplicates()의 사용법과 활용 방법에 대해서 알아보자. 1. drop_duplicates() pandas의 drop_duplicates()는 데이터프레임에서 중복된 행을 제거하는 메서드이다.DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)subset : 중복 여부를 확인할 열을 지정 (기본 값 None → 모든 열을 기준으로 중복 확인)keep : 중복된 행이 있을 때 남길 행을 선택first (..
ValueError: time data "" doesn't match format "%Y-%m-%d", at position 1. You might want to try: 해당 오류는 pandas.to_datetime을 사용할 때 날짜 문자열이 예상 형식과 일치하지 않을 때 발생한다. 해결방법 1. 정확한 날짜 형식 지정하기df['date'] = pd.to_datetime(df['date'], format="%Y/%m/%d")format에 정확한 날짜 형식을 지정해준다. 2. 다양한 형식의 날짜가 섞여 있는 경우df['date'] = pd.to_datetime(df['date'], format='mixed')다양한 형식의 날짜가 섞여 있을 경우, format='mixed'를 사용하여 각 날짜의 형식을 ..

raise ValueError("The number of derivatives at boundaries does not " f"match: expected {nt-n}, got {nleft}+{nright}")ValueError: The number of derivatives at boundaries does not match: expected 1, got 0+0 위 오류 메시지는 polynomial이나 spline 보간을 수행할 때, 경계에서 제공된 도함수 조건의 수가 내부적으로 기대하는 수와 일치하지 않을 때 발생한다. 1. 발생 원인 1-1. 데이터 포인트 부족- 보간 대상 열에 유효한(결측치가 아닌) 값이 너무 적어 지정한 차수(order)를 만족할 만큼 경계 ..

데이터를 분석하기 전에 전처리(data preprocessing) 과정이 필수적이다.데이터는 종종 누락(missing value), 이상치(outliers), 데이터 형식 불일치 등의 문제를 가지고 있으며, 이를 정리해야 정확한 분석과 머신러닝 모델 학습이 가능하다. 데이터에는 종종 비어 있는 값(결측 치, NaN)이 존재할 수 있다.Pandas는 결측값을 쉽게 탐지하고 처리할 수 있는 다양한 함수를 제공한다. 이번 글에서는 Pandas를 활용한 결측치 처리 방법에 대해서 알아보자! 1. 결측치 확인 각 요소가 결측치인지 확인하여 불리언 series/DataFrame을 반환한다.import pandas as pdimport numpy as npdf = pd.DataFrame({ 'A': [1, 2..

이전에 NumPy 배열(ndarray)을 생성하고 다루는 기본적인 방법을 알아봤는데,이번 글에서는 NumPy 배열을 활용한 다양한 연산 및 함수에 대해서 알아보자! 1. 기본 연산 NumPy는 Python의 기본 연산자 (+, -, *, /, ** 등)를 활용하여 배열 요소 간의 연산을 빠르고 효율적으로 수행할 수 있다.import numpy as nparr1 = np.array([1, 2, 3, 4, 5])arr2 = np.array([10, 20, 30, 40, 50])# 배열 간 연산print("덧셈:", arr1 + arr2) # [11 22 33 44 55]print("뺄셈:", arr1 - arr2) # [-9 -18 -27 -36 -45]print("곱셈:", arr1 * arr2) #..

Python에서 함수를 생성하는 방법에 대해서 알아보자. 함수를 생성하는 이유코드의 재사용성과 모듈화를 위한 핵심요소 모든 프로그래밍 언어가 그렇듯 모듈화 및 재사용성이 높아진다 하더라도 성능 향상보다는 코드 품질, 유지보수성, 확장성에 더 큰 영향을 미친다. 코드품질이 좋아지면 유지보수 용이성으로 이어지고 이는 개발시간 단축으로 연결된다. 자 이제 python 함수를 생성하고 사용을 해보자. 기본 함수#def 함수명(매개변수): def writeName(name): print(f"{name}") writeName("hanker")def는 define의 앞 글자를 따서 사용하는데 이는 정의하다 라는 단어의 뜻 그대로 쓰인다. writeName 함수명은 본문의 내용을 모르더라도 함수명만 보고 어떠한 기능을..

파이썬 스크립트 파일을 실행(exe)파일로 만들어보자.예전에 윈도우 실행파일 만들때 txt파일에 cmd 명령어 입력하고 소스코드 파일 실행시키고 그랬던 기억(?)이 있는데,이제는 너무 편하게 만들 수 있다. 만들어보자! pyinstaller라는 라이브러리를 사용했다. Terminal창을 키고 pip install pyinstaller [Enter]다운로드가 진행된다 다운로드가 완료되면 pyinstaller 라는 명령어를 사용할 수 있게되는데,python코드가 있는 디렉터리로 이동해서 pyinstaller --onefile 파이썬파일명.py 를 입력해주면빌드가 되는데, 빌드가 완료되면 해당 디렉터리에 build, dist 디렉터리가 생성된다. 우리가 사용해야할 exe파일은 dist 디렉터리안에 위치해..