본문 바로가기

엑셀

엑셀 외부 데이터 가져오기 - CSV 텍스트 웹 데이터 불러오기

반응형

다른 시스템에서 내보낸 CSV 파일, ERP에서 추출한 텍스트 파일, 웹페이지의 표 등을 엑셀로 가져와야 하는 경우가 많아요.
단순히 더블클릭으로 열면 한글이 깨지거나, 숫자가 텍스트로 인식되는 문제가 발생합니다.

 

이 글에서는 CSV/텍스트 파일을 올바르게 가져오는 방법, 웹 데이터 가져오기, 자주 발생하는 문제와 해결법을 다룹니다.

CSV 파일이란

CSV(Comma Separated Values)는 쉼표로 값을 구분한 텍스트 파일이에요.
확장자가 .csv이고, 메모장으로 열어보면 이렇게 생겼어요.

 

이름,부서,매출
김민수,영업팀,450
이지은,개발팀,200

 

엑셀에서 직접 열 수 있지만, 인코딩이나 구분자 문제가 생길 수 있어요.

CSV 파일 가져오기 - 방법 1 (데이터 탭 사용, 권장)

가장 안전한 방법이에요. 인코딩, 구분자, 데이터 형식을 직접 지정할 수 있습니다.

 

  1. [데이터] → [텍스트/CSV에서] (또는 [외부 데이터 가져오기] → [텍스트에서])
  2. CSV 파일 선택 → [가져오기]
  3. 미리보기 화면에서 확인:
    • 파일 원본(인코딩): UTF-8 또는 949(한글)
    • 구분 기호: 쉼표, 탭 등
    • 데이터 형식 감지: 자동 또는 수동 설정
  4. [로드] (또는 [데이터 변환]으로 파워쿼리에서 추가 편집)

 

한글이 깨지면 인코딩을 바꿔보세요.
한국어 시스템에서 만든 파일은 대부분 "949" 또는 "EUC-KR"이고, 최근 파일은 "UTF-8"이 많아요.

CSV 파일 가져오기 - 방법 2 (직접 열기)

파일 탐색기에서 CSV 파일을 더블클릭하면 엑셀이 자동으로 열어요.
하지만 이 방법은 몇 가지 문제가 생길 수 있어요.

 

문제 원인 증상
한글 깨짐 인코딩 불일치 글자가 ??? 또는 네모로 표시
앞자리 0 사라짐 숫자 자동 변환 "001" → 1
긴 숫자 변환 지수 표기 "1234567890123" → 1.23E+12
날짜 자동 변환 날짜 인식 "3-15" → 3월 15일

 

이런 문제를 피하려면 방법 1(데이터 탭)을 사용하세요.

앞자리 0이 사라지는 문제 해결

사번(001, 002)이나 우편번호(03045) 같은 데이터에서 앞의 0이 사라지는 건 가장 흔한 문제예요.

 

해결 방법 (데이터 탭으로 가져올 때):

  • 미리보기에서 해당 열의 데이터 형식을 "텍스트"로 변경
  • Excel 365에서는 열 머리글을 클릭하고 형식을 "텍스트"로 지정

 

이미 열어버린 경우:

  • 원본 CSV를 다시 방법 1로 가져오는 게 가장 확실해요
  • 또는 셀 서식을 텍스트로 바꾼 뒤 다시 입력해야 합니다

텍스트 파일 가져오기 (탭 구분, 고정 너비)

CSV와 같은 방법으로 가져올 수 있어요.
구분자만 다릅니다.

 

  1. [데이터] → [텍스트/CSV에서]
  2. 파일 선택
  3. 구분 기호를 "탭", "공백", "세미콜론" 등으로 변경
  4. [로드]

 

고정 너비 파일(열 위치가 문자 수로 고정)의 경우:

  • 구분 기호 대신 "고정 폭"을 선택
  • 미리보기에서 열 구분선을 클릭해 위치를 지정

웹 데이터 가져오기

웹페이지에 있는 표 데이터를 엑셀로 가져올 수 있어요.

 

  1. [데이터] → [웹에서]
  2. URL 입력 → [확인]
  3. 탐색기에서 가져올 표(Table) 선택
  4. [로드]

 

이 기능은 HTML 테이블을 인식해요.
모든 웹페이지에서 작동하는 건 아니고, 표(table) 태그로 구성된 데이터만 가져올 수 있습니다.

 

[데이터] → [모두 새로 고침]을 누르면 웹 데이터를 최신 상태로 갱신할 수 있어요.

연결 관리와 새로 고침

외부에서 가져온 데이터는 "연결"이 유지돼요.
원본 파일이나 웹페이지가 변경되면 새로 고침으로 업데이트할 수 있습니다.

 

  • 수동 새로 고침: [데이터] → [모두 새로 고침] (Ctrl+Alt+F5)
  • 자동 새로 고침: 연결 속성에서 "주기적 새로 고침" 설정 가능

 

연결을 끊고 데이터만 유지하려면:
[데이터] → [쿼리 및 연결] → 연결 우클릭 → [삭제]

붙여넣기로 가져오기

웹 브라우저, 메모장, 다른 프로그램에서 데이터를 복사(Ctrl+C)한 뒤 엑셀에 붙여넣기(Ctrl+V)하는 방법도 있어요.

 

선택하여 붙여넣기(Ctrl+Alt+V)를 사용하면:

  • 텍스트: 서식 없이 텍스트만 붙여넣기
  • Unicode 텍스트: 한글 등 다국어 지원
  • HTML: 웹페이지의 표 서식 유지

 

간단한 데이터는 이 방법이 빨라요.

자주 하는 실수 / 주의사항

1. CSV를 엑셀로 저장하면 수식/서식 손실

CSV는 텍스트 파일이므로 수식, 서식, 여러 시트 등을 저장할 수 없어요.
CSV로 작업한 뒤에는 .xlsx로 별도 저장하세요.

2. 인코딩을 잘못 선택하면 한글이 깨짐

UTF-8 파일을 ANSI(949)로 열거나 그 반대면 한글이 깨져요.
미리보기에서 한글이 정상 표시되는 인코딩을 선택하세요.

3. 대용량 CSV는 엑셀 행 제한(1,048,576행)에 걸릴 수 있음

100만 행이 넘는 파일은 엑셀에서 전부 열 수 없어요.
이런 경우 파워쿼리로 필터링하거나, 파일을 분할해서 가져와야 합니다.

관련 기능 안내

파워쿼리(데이터 변환)를 사용하면 가져오기 과정에서 데이터 정제까지 자동화할 수 있어요.
확장 시리즈 마지막 편에서 파워쿼리 기초를 다룰 예정입니다.

 

다음 글에서는 하이퍼링크와 목차 만들기를 다룰 예정이에요.
시트 간 이동 링크, 외부 파일/웹 링크, 자동 목차 구성 방법입니다.

반응형