일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- kepler.gl
- 지도
- 인코등
- API
- covid
- 공공데이터포털
- riotapi
- geopandas설치
- 막대그래프
- geopnadas
- r
- 코로나
- OSMnx
- pipwin
- 시각화
- 라이엇
- QGIS라벨링
- 파이썬
- Python
- kepler
- 에러
- 오류
- Folium
- geopandas에러
- 마커클러스터
- 라이엇api
- map
- 오픈API
- covid19
- matplotlib
- Today
- Total
목록분류 전체보기 (50)
Nerdy
# 텍스트 데이터 해당 텍스트 파일은 2022년 4월 11일 오후 젤렌스키 우크라이나 대통령이 국회 화상연설에서 러시아의 우크라이나 침공의 참담한 현실을 말한 연설문 텍스트 내용이다. 앞에서 했던 Wordcloud - 1 에서 사용한 형태소 분석과 텍스트 전처리를 다른 조건으로 적용하여 Wordcloud 시각화를 만들어 볼 예정이다. # 이전 Wordcloud - 1 https://whiplash-bd.tistory.com/32 [Python] 젤렌스키 대통령 연설문 Wordcloud 만들기 # 텍스트 데이터 해당 텍스트 파일은 이번 러시아 침공으로 인해 젤렌스키 우크라이나 대통령이 연설한 내용을 담은 파일이다. 연설문 텍스트 파일을 활용해 단어 시각화인 word cloud를 만들어본 whiplash-b..
# 텍스트 데이터 해당 텍스트 파일은 이번 러시아 침공으로 인해 젤렌스키 우크라이나 대통령이 연설한 내용을 담은 파일이다. 연설문 텍스트 파일을 활용해 단어 시각화인 word cloud를 만들어본다. 워드클라우드(wordcloud)는 데이터에서 얻은 태그들을 분석하여 중요도 또는 인기도 등을 고려하여 시각적으로 표시하는 방법이며 각 태그들은 중요도에 따라 글자의 굵기와 색상 형태가 변한다. 1. 라이브러리 import wordcloud를 만들기 위해 사용할 라이브러리를 import 해준다. from wordcloud import WordCloud import matplotlib.pyplot as plt from collections import Counter from konlpy.tag import Ok..
# csv 파일 산점도 그래프를 그리기 위해 사용할 데이터는 iris 데이터다. iris 데이터는 꽃잎의 각 부분의 너비와 길이 등을 측청한 데이터이며 150개의 레코드로 구성되어 있다. 1. 데이터 가져오기 대상 데이터를 가져오기 위해 pandas 라이브러리를, 산점도 그래프를 그리기 위해 matplotlib 라이브러리를 import한다. 데이터 파일을 읽기 위해 pd.read.csv 함수를 사용하고 대상 컬럼은 1번 컬럼(Sepal.Length) 와 3번 컬럼(Petal.Length)으로 한다. import pandas as pd import matplotlib.pyplot as plt # 파일 가져오기 iris = pd.read_csv("ch9_data/iris.csv") iris # 대상 컬럼 객..
matplotlib는 차트를 그리는 시각화 라이브러리 패키지이며 원 그래프 또는 원형 차트라고 부르는 파이 차트를 데이터를 활용하여 만들어보도록 한다. # csv 파일 데이터 '04-01-2021.csv' Data : 전 세계 코로나 확진자 감염수와 발병 지역, 사망 수 등의 수치들이 담긴 데이터 1. 데이터 가져오기 pandas의 pd.read.csv 함수를 사용하여 데이터를 가져와 객체에 담는다. iris = pd.read_csv("ch9_data/iris.csv") iris df = pd.read_csv('04-01-2021.csv', na_filter=True) test1 = pd.DataFrame(df) test1 2. 데이터 그룹화 코로나 확진 관련 데이터가 담긴 '04-01-2021.csv'..
Oracle SQL 작업을 파이썬과 R에서 작업을 할 수 있도록 설정하는 방법이다. Tool Version Python : 3.9.7 Python IDE : PyCharm R : 3.6.3 Oracle SQL 접근을 하기 위해 먼저 사전작업을 해준다. 1. C드라이브에 OracleTest 폴더 생성 2. OracleTest 폴더에 dirver ojdbc6 저장 ojdbc6,jar 파일을 찾는 방법은 다음과 같다. C:\oraclexe\app\oracle\product\11.2.0\server\jdbc\lib 해당 경로를 복사한 뒤 ojdbc6,jar 파일을 복사하여 OracleTest 폴더에 붙여넣으면 된다. Oracle SQL 설치 당시 경로 default를 C드라이브로 설정하였으면 아마 찾을 수 있을..
시계열 분석이란? 어떤 현상에 대해서 시간의 변화에 따라 일정한 간격으로 현상의 변화를 기록한 시계열 데이터를 대상으로 미래의 변화에 대한 추세를 분석하는 방법 일반 분석과는 다르게 시간의 흐름을 고려한다는 특징이 있어 분석을 통해 향후 판매량 예측, 다음달 항공기 이용 승객 등 예상되는 변화를 예측할 수 있다는 장점이 있지만, 연구자가 만든 시계열 모형을 이용하여 예측하고자 할 때 천재지변, 정치, 경제, 사회, 문화 영역에서 일어나는 여러가지 변수들이 발생하여 일일이 고려하지 못하기 때문에 오차가 발생할 수 있다는 단점이 있다. 과거 10년간 일별 종가기준 KOSPI 지수 데이터를 대상으로 시계열 분석을 해본다. 1. 파일 불러오기 KOSPI
ㅣ주성분 분석(principal component analysis, PCA) 개요 서로 상관관계를 갖는 많은 변수를 상관관계가 없는 소수의 변수로 변환하는 차원축소 기법 ㅣ주성분 분석의 목적 데이터 셋에 많은 변수가 포함될수록 분석의 복잡성이 증가할 뿐만 아니라 의미있는 정보를 찾아내기가 쉽지 않다. 또한 분석할 대상의 변수가 많다고 모두 활용하는 것은 좋지 않으며 오히려 변수간의 다중공선성이 있을 경우 분석 결과에 영향을 줄 수 있다. 이럴경우 데이터 셋에 포함된 다수의 변수를 몇개의 관리 가능하고 해석 가능한 소수의 변수로 축소하는 것이 유용, 즉 데이터 셋의 차원을 줄여줌으로써 데이터의 복잡성을 감소시킬 수 있다. *다중공선성 : 독립변수들 간의 선형 관계를 나타내는 것. 독립변수들 간의 높은 상관..
계정 : sys 테이블 : EMP, DUAL 1. 세기, 년, 월, 일, 시, 분, 초를 나타내는 내부 숫자인 7 바이트 형식으로 날짜 저장 2. 기본 날짜 표시와 입력 형식은 DD-MM-YY 3. 유효한 오라클 날짜는 기원전 4712 년 1 월 1 일부터 서기 9999 년 12 월 31 일까지이다. 4. 날짜 데이터 타입의 값에 대해 실행되며 숫자를 반환하는 months_between 함수를 제외하고 모든 날짜 함수는 날짜 데이터 타입의 값을 반환 - 오라클은 날짜를 숫자로 저장하므로 산술 연산자로 다음과 같이 산술 계산을 할 수 있다. □ Date + Number 날짜 연산: 일수를 날짜에 더하며 결과는 날짜 □ Date + Number / 24 날짜 연산: 24 로 일수를 나누면 시간이 되며 시간을..