📊python/파이썬, 데이터분석 22

선형회귀

x 리스트, y리스트가 있고. 둘의 관계를 f(x)로 정의하고 있을 때 x와 y의 요소들을 통해 f(x)를 찾아낸는 것이 선형회귀이다. 찾아내는 법은 f(x)=wx+b를 우리의 목표라고 한다면 아직 알지못하는 f(x)를 찾기위해 값을 마구잡이로 집어넣을 실험체인 H(w, b) 함수가 있다고 하고. 실제 f(x)를 찾기 위해서 리스트의 값으로 이루어진 좌표들과, 실험체 H(w,b)에 리스트들의 값을 넣은 값들의 차이가 가장 작게나오도록 하는 함수H(w,b)를 끊임없이 계산해서 찾게 만든다. 위의 요소들마다의 차이들을 제곱해서 모두 더한후, 그 요소의 갯수만큼 나눠주게 된다는... 그런 구체적인 계산방식으로 가장 f(x)에 가까운 H(w,b)를 찾게 되는데 이 구체적 계산방식을 cost(w,b). 즉 최소제..

파이썬 데이터분석(6)[numpy 여러 메서드들][pycharm 기준]

오름차순 sort() 이후, 반대로 요소를 불러오도록 해서 내림차순으로 정렬하 행을 기준으로 정렬하면, 아래 리스트처럼 각 열마다 묶어서 우선순위대로 나열. 0~10까지의 숫자 중으로 5칸을 채워서 생성. 원본을 복사해와서 사본(원본2)을 값을 바꿔서 쓰고 싶은데 사본의 일부를 바꾸니 원본마저 바뀌는 번거러움 발생. copy()를 통해 불러오면 원본과 이어지지 않아, 사본을 바꿔도 원본이 유지됨 전체적인 감상은 자바스크립트에서 보던 함수들이 파이썬에서 많이 보여서 numpy를 쓸 때, 굉장히 친숙하다는 것이다.

파이썬 데이터분석(4)[numpy 기초][pycharm 기준]

1차원(행 축,가로 axis 0) :직선하나의 나열을 벡터 2차원(열 축, 세로 axis 1) :2개의 선으로의 공간 표현을 Matrix 즉, 행렬. 3차원(채널 축 axis 2) : 3차원이상을 Tensor라고 한다. pycharm -단축키- ctrl + w :부분지정.(한번은 커서앞, 두번이 한행, 세번은 전체) ctrl + shift + f :코드실행 미리보기 ctrl + d 한줄 복사 numpy 기본 메서드 사용해보기 행렬의 입출력 파이썬의 경우, 배열을 어디까지 만들라고 하면, 그 앞까지 만드는 특성이 있다. 배열 합치기 : concatenate([배열1, 배열2, ....]) 배열 형태 바꾸기 : reshape((행, 열)) 두 행 생성 후, 합치기(예시는 axis=0 을 통해 가로축. 행을 ..

파이썬 데이터분석(3)[파일 경로 설정]

절대 경로는 최상위 dir이 포함된 경로. 상대 경로는 현재 위치한 곳 기준의 경로. 주피터 노트북 설치한 곳으로 가면된다. :C -> user -> 사용자(혹은 내 컴퓨터 이름)에 들어가서 이 폴더가 있는 곳이 jupyter가 설치된 곳이자, jupyter 노트북이 나타내는 곳이다. 걍 그대로 가상환경은 안하고 속성 들어가서 바탕화면 폴더를 상대경로로 지정한뒤에 쓰는중임(밑의 링크를 참조하자. 정리가 잘되어 있다.) https://limitt.tistory.com/129 data는 폴더로 따로 관리했는데 vscode처럼 그냥 data폴더에 / 쓰면됨 저기서 tab키를 누르면 파일이 있다면 빠르게 목록을 보고서 지정선택으로 불러올 수 있음. 혹시나 다른 컴퓨터에서 주피터를 쓰게 되었는데 파일들을 관리해야..

파이썬 데이터분석(2)(파이썬 기초복습 및, pandas 기초)

파이썬 기본 문제들(틀린부분) 문자열은 1,0이 아닌 문자열일 뿐임. push는 아래의 예시처럼 뒤에 추가하는 건 맞지만, 출력을 더해진 길이값만을 출력. const count = animals.push('cows'); console.log(count); // Expected output: 4 근데 중요한건... push()는 파이썬에 없다.ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ append만이 답이다. 제어문(조건문, 반복문) # enumerate를 사용하면 인덱스 번호와 원소를 같이 가져올 수 있습니다. for i, val in enumerate(lang): print(i, val) #결과 : 0 pyhon 틀린이유가 부주의 때문이지만, 아래의 메서드들을 몰랐고, 헷갈려하므로 틀리길 잘했다는 생..

파이썬 데이터분석(1)[주피터 가상환경 설정 및 주피터 실행, 단축키]

https://limitt.tistory.com/129 [한 번에 해결] 주피터 노트북 & 아나콘다 설치하고, 기본 작업경로 설정 후 가상환경 만들기까지 파이썬을 이용한 데이터 분석에서, 셀 단위로 코드를 입력하고 바로바로 결과를 확인할 수 있는 아나콘다의 주피터 노트북은 굉장히 편리하다. 컴퓨터를 리셋하면서 주피터 노트북도 함께 없어 limitt.tistory.com 위의 과정들을 설치 및, 진행하고나서 아래처럼 아나콘다 Prompt에 들어가서 아래 명령어를 통해 가상환경(pybook)에 들어가서 jupyter를 실행해주면 된다. 이제 자동으로 크롬창에 주피터가 실행된다. 그냥 맨위의 링크대로 " "안에 바탕화면 폴더 경로 지정해서 그곳에 파일 저장하게끔 하면서 하고 있다. 가상공간해준 jupyter는..

파이썬 기본이론 정리(5) [입출력, input 사용, 출력서식, 메서드]

표준 입출력 sep=" "를 통해서 요소들 사이 사이에 원하는 기호 삽입 가능 end=" "를 통해서 문자의 마지막 여백을 원하는 기호로 바꿔 입력할 수 있다. 이때 여백이 없어져서, 자동 줄바꿈이 없어진다. 좌정렬(ljust(칸 확보 수)), 우정렬(rjust(칸 확보수), sep=":") items()는 행렬({})의 key와 value 값 둘다 출력할 수 있도록 해줌. keys() + values() = items() 빈칸을 0으로 채워주고 싶다면 .zfill(총 숫자공간 갯수) 메서드 사용. input 사용할 때 숫자로 입력받아도 무조건 type은 문자열 타입이다. 출력값의 타입이 str임을 확인할 수 있다. 다양한 출력서식 소숫점 아래 원하는 만큼 나타내기 문제7 txt 파일 50개 제작하기. ..

파이썬 기본이론 정리(4)[함수선언, 가변선언, 지역,전역변수]

함수선언 def 함수명(): 함수내용 = 을 통해 키워드에 값을 부여하면, 그 키워드에 해당하는 값이 순서가 섞여있더라도 함수의 매개변수 순서대로 출력된다. 가변인자 *가변인자명을 통해서 선언. 두 함수의 매개변수 갯수가 다름에도 가변수를 통해 묶어서 정의해서 선언하게 되면 다른 갯수의 매개변수를 표현해야하더라도 한꺼번에 사용이 가능 지역변수 그 함수 안에서만 적용되는 변수. 함수내에서 전역변수와 같은 이름의 변수를 쓴다고해서, 함수를 벗어난 코드에서는 영향력 행사가 불가능한 변수이다.. 전역변수 global을 사용해서 그저 지역변수에 머무를 checkpoint함수 안의 gun 변수를 전역 공간에 있는 gun을 불러와서 함수 내에서 쓸 수 있게 해줌. 함수의 계산이 함수 내에서만 머물지 않고 최종 결과 ..

파이썬 기본이론 정리(2)[문자열 제어, 튜플, 행렬]

슬라이싱[배열을 통해 간단히 가능.] 마치 js의 슬라이싱할 때의 slice()메서드를 사용한것과 동일하다. 파이썬은 그대로 위치와 범위만 배열에서 지정해주면 알아서 데려오는 엄청 편리한 기능을 제공한다. 여러 문자열 처리 함수들 8, 10행 index("찾을 문자", 탐색시작 위치) 위치 생략시, 0부터 시작 +1을 하면 처음 찾을 문자를 발견한 곳. 그 다음 위치 부터 시작 길이 len() isupper() 대문자 인지 아닌지를 불리언 값으로 반환 find() 메서드는 찾는 값이 없으면 -1을 반환 index() 메서드는 없으면 에러가 난다. count() 문자 갯수 출력. 문자열 포멧 % 기호를 사용해서 원하는 값을 집어 넣을 수 있다. % 정수 % "문자" % ("","") 이런식으로 다양한 값들..