본문 바로가기 메뉴 바로가기

Connecting dots via Data

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

Connecting dots via Data

검색하기 폼
  • 분류 전체보기 (44)
    • 책 논문 읽기 (1)
    • 데이터 분석 (39)
      • 전처리 (8)
      • 생물 및 의료 데이터 (13)
      • 확률 통계 (10)
      • 딥러닝 (7)
      • 인과추론 (DAG) (1)
    • 데이터 베이스 (0)
      • 지식 그래프 (Knowled.. (0)
      • Neo4j (0)
      • SQL \ NoSQL (0)
    • 프로그래밍 (4)
      • 리눅스 (2)
      • Trouble shootin.. (2)
    • 의사 결정을 위한 데이터 통.. (0)
      • 인간 지능 (Human Co.. (0)
      • 인공 지능 (Artifici.. (0)
  • 방명록

보간법 (1)
결손값 처리

1. NAN 값 처리(제거, 변경, 평균값 대체) SQL> SELECT * table WHERE weight is not NULL COALESCE(weight, 1) AS weight, x FROM table COALSCE(weight, SELECT AVG(weight) FRM table)) AS weight R> table %>% drop_na(weight) 또는 na.omit(table) table %>% replace_na(list(weight=1)) 2. PMM(predictive mean matching) 방법 - 값이 있는 데이터에서 회귀 모델 구성 -> 계수, 오차의 분포 계산 -> 계수와 오차의 분포에서 새로운 계수와 오차 분산 생성 -> 생성한 계수와 오차 분산에 따른 회귀모델로 예측값 ..

데이터 분석/전처리 2023. 12. 22. 16:52
이전 1 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
  • GPU설치
  • SNP
  • cnn
  • pre-train
  • 딥러닝
  • ECG
  • Bioinfo
  • PTB
  • r
  • missing_value
  • 생존곡선
  • GradCam
  • psychopy
  • NGS
  • 실험통계
  • rgb2gray
  • 그룹비교
  • vcf
  • fasta
  • HRV
  • sounddevice
  • plink
  • pmm
  • gray2rgb
  • 평균분석
  • sequenced data
  • 생존함수
  • 인공지능
  • 생존분석
  • featuremap
more
«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
글 보관함

Blog is powered by Tistory / Designed by Tistory

티스토리툴바