분류 전체보기
-
머신러닝 전처리 - interpolate(보간)머신러닝 2025. 3. 21. 19:21
1. 보간(Interpolation)이란?보간은 주어진 데이터 포인트 사이의 값을 예측하는 기법입니다. 즉, 이미 알려진 데이터 샘플을 기반으로 연속적인 함수 또는 모델을 사용하여 중간값을 추정하는 과정이다. 2. 머신러닝에서 보간이 필요한 이유보간은 데이터 분석과 머신러닝에서 중요한 역할을 한다. 1. 결측값 처리실측 데이터에서 일부 값이 누락된 경우, 보간 기법을 활용하여 값을 채울 수 있다. 2. 고해상도 데이터 생성이미지 확대 또는 신호 처리에서 원본 데이터를 기반으로 더 정밀한 데이터를 생성할 때 사용된다. 3. 시계열 데이터 예측일정한 간격의 데이터를 확보하기 위해 중간 값을 보간할 수 있다. 4. 신뢰성 높은 모델 학습데이터가 적을 경우, 보간된 데이터를 추가하여 모델 학습의 성능을 향상할 ..
-
[ Pandas ] 판다스 요약 함수와 매핑: 데이터 분석 필수 기능판다스 2024. 10. 27. 23:35
Pandas는 데이터의 통계적 요약과 그룹화, 데이터 변환 등 다양한 기능을 제공하여 데이터 분석을 쉽게 만들어줍니다. 이번 포스팅에서는 요약 함수와 매핑 함수를 사용하여 데이터를 요약하고 변환하는 방법을 다뤄보겠습니다. 예제에서는 titanic 데이터셋을 사용하여 설명하겠습니다. 1. 데이터 준비하기먼저, titanic 데이터셋을 불러와서 요약 함수와 매핑 함수 사용법을 실습해 보겠습니다.import pandas as pd# Titanic 데이터셋 불러오기url = "https://raw.githubusercontent.com/datasciencedojo/datasets/master/titanic.csv"df = pd.read_csv(url)print(df.head()) 타이타닉 데이터셋은 탑승자의 나..
-
[ Pandas ] 판다스 인덱싱, 선택, 할당: 데이터 다루기 기본 가이드판다스 2024. 10. 27. 13:21
Pandas에서 데이터를 다루기 위해서는 인덱싱과 선택, 그리고 데이터를 할당하는 방법을 이해하는 것이 중요합니다.이번 포스팅에서는 Pandas에서 데이터에 접근하고 선택하는 다양한 방법을 예제와 함께 상세히 알아보겠습니다.1. 데이터 준비하기우선, titanic 데이터셋을 불러오겠습니다. 이 데이터는 타이타닉 탑승자의 정보를 포함하고 있어 다양한 인덱싱과 선택 기능을 학습하기에 좋은 예제입니다.import pandas as pd# Titanic 데이터셋 불러오기url = "https://raw.githubusercontent.com/datasciencedojo/datasets/master/titanic.csv"df = pd.read_csv(url)print(df.head()) 타이타닉 데이터셋에는 탑승..
-
[Pandas] 판다스로 데이터 생성, 읽기, 쓰기판다스 2024. 10. 26. 22:03
Pandas는Pandas는 데이터 분석을 위한 필수 라이브러리로, 다양한 소스에서 데이터를 생성, 읽기, 쓰기 쉽게 해줍니다. 이번 글에서는 Pandas를 이용해 데이터를 생성하고 파일로 저장하거나 불러오는 다양한 방법을 알아보겠습니다.1. 데이터 생성하기Pandas에서 데이터를 생성하는 기본적인 방법은 DataFrame을 사용하는 것입니다. DataFrame은 2차원 테이블 구조로, 데이터와 열 이름을 설정하여 손쉽게 생성할 수 있습니다.import pandas as pd# 간단한 데이터 생성data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}df = pd.DataFrame(data)print(df)위 코드에서는 data라는 딕셔너리를 통..
-
[Pandas] 판다스 기초 문법 익히기판다스 2024. 10. 25. 18:23
Pandas는판다스(Pandas)는 데이터 분석을 할 때 가장 많이 사용하는 파이썬 라이브러리 중 하나입니다.엑셀처럼 데이터를 다루면서도 프로그래밍의 강력함을 함께 사용할 수 있어 매우 효율적입니다. 1. 객체 생성하기판다스에서 가장 중요한 두 가지 데이터 구조는 Series와 DataFrame입니다. Series는 1차원 배열, DataFrame은 2차원 테이블 구조로, 각각 엑셀의 셀과 시트와 비슷하다고 생각하면 이해하기 쉽습니다.import pandas as pdimport numpy as np# Series 생성s = pd.Series([1, 3, 5, np.nan, 6, 8])# DataFrame 생성dates = pd.date_range("20230101", periods=6)df = pd.D..
-
[ Python ]카테고리 없음 2024. 9. 30. 23:07
input() 함수파이썬의 input() 함수는 사용자로부터 직접 값을 입력받기 위한 목적의 함수입니다.다른 함수들처럼 변수나 파생변수를 활용하지 않고 사용자의 입력 데이터를 받아 상호작용 하는 기능입니다. input() 함수의 구조와 특징input() 함수 구조는 2단계로 구성되어 있습니다.1. 사용자에게 입력 데이터 요구2. 입력받은 데이터를 활용하여 문자열로 반환 input() 함수 코드 예제name = input("이름을 입력해주세요")print("안녕하세요, " + name + "님!") 코드를 실행하면 "이름을 입력하세요"라는 메시지가 표시됩니다.이름을 입력한 후 엔터 키를 누르면, 입력된 이름을 변수 name에 저장합니다.변수에 저장된 이름은 "안녕하세요, [name]님!"으로 출력됩니..
-
[ 프로그래머스 / Python ] 문자열 내 p와 y의 개수카테고리 없음 2024. 8. 31. 23:03
문제 설명대문자와 소문자가 섞여있는 문자열 s가 주어집니다. s에 'p'의 개수와 'y'의 개수를 비교해 같으면 True, 다르면 False를 return 하는 solution를 완성하세요. 'p', 'y' 모두 하나도 없는 경우는 항상 True를 리턴합니다. 단, 개수를 비교할 때 대문자와 소문자는 구별하지 않습니다.예를 들어 s가 "pPoooyY"면 true를 return하고 "Pyy"라면 false를 return합니다. 제한사항문자열 s의 길이 : 50 이하의 자연수문자열 s는 알파벳으로만 이루어져 있습니다. 나의 풀이방법 1count() 함수 활용def solution(s): s = s.lower() return s.count('p') == s.count('y') 추가 설명 링크