< 참고자료 >
https://dreamlog.tistory.com/607
우분투 20.04에서 Apache Spark 설치
Apache Spark 개요 Apache Spark는 대용량 데이터 처리를 위한 통합 분석 엔진으로 배치와 스트리밍 데이터를 고성능으로 처리하고 자바, 스칼라, 파이썬, R 등의 다양한 프로그래밍 언어를 지원한다. Ap
dreamlog.tistory.com
과제였는데, 우리 동아리 회장님이 "너 할당받았던 개발환경에다가 설치한번 해봐라" 해서 바로 ㄱ
위에 참고한 글이 정말 설명이 잘 되어있어서 쉽게 진행하였다.
기본적으로 java, Hadoop, Spark만 버전 잘 맞춰서 깔아주면 된다.
애초에 Spark랑 Hadoop은 같이 깔리니까 웬만하면 헤멜일 별로 없는듯...
바꿔줄 부분은 wget으로 스파크 설치할때 버전만 최신버전으로 바꾸면된다.
나는 할당받은 포트로 접속포트를 바꾸고 싶어서
start-master.sh --port (원하는 포트) --webui-port (원하는 포트)
이렇게 바꾸어주었다.
브라우저 접속은 http://접속할아이피:마스터포트 로 들어간다.
본인컴퓨터라면 127.0.0.1로 접속하면 되지만, 나는 원격서버에 설치하였기때문에 서버컴 아이피로 접속하였다.
<설치정보>
Spark : 3.2.3
Hadoop : 3.2
Java : JDK 11.0.18
master : Spark standalone
'CS > 기타 조각글' 카테고리의 다른 글
[빌드 및 컴파일] opencv static library & aarch64 cross-compile (0) | 2024.12.02 |
---|---|
[코테] 실행속도 차이 : scanf/printf/\n과 cin/cout/endl (0) | 2023.09.22 |
[복습] 컴퓨터그래픽스 중간고사 대비 복습 (이론) (0) | 2023.04.24 |
[이산수학] 집합과 논리 (0) | 2023.03.08 |
댓글