'CS' 카테고리의 글 목록

소켓 통신 기술의 변화. 왜 멀티플렉싱인가?

epoll과 멀티플렉싱1. 전통적인 웹소켓 통신Blocking IO 기반의 멀티스레드 방식이다. 클라이언트가 accept()으로 요청하면 새로운 스레드를 생성하고, 생성된 스레드는 해당 클라이언트와 데이터 송수신을 전담한다. 이 과정에서 accept(), read(), write()와 같은 IO 함수들은 데이터가 준비될 때까지 해당 스레드를 Blocking 시킨다.따라서 특정 클라이언트의 느린 IO가 존재한다면 그 클라이언트의 해당 워커 스레드는 Block 된다. 즉, 일시정지된다.2. Non-blocking I/ONon Blocking IO는 IO 작업을 요청했을 때 그 작업이 끝날 때까지 기다리지 않고 즉시 다음 코드를 실행하는 방식이다. 조금 더 정확히 말하자면 제어권을 반환하는 방식이다.fcntl..

CS/Computer Network 2025.08.19

RDBMS와 NoSQL에 대한 고찰

RDBMS, NoSQL1. RDBMSRDBMS는 데이터를 관계를 통해 관리하는 시스템이다. 여기서 관계는 테이블로 표현되며 2차원 구조이다.주요 특징Schema-on-Write : 데이터를 저장하기 전 테이블의 구조를 명확히 정의해야 한다.데이터 무결성 보장 : PK, FK 등의 제약 조건을 통해 데이터의 중복을 방지하고 관계의 유효성을 보장한다.SQL (Structured Query Language)트랜잭션 (Transaction)과 ACID 원칙RDBMS는 SQL을 사용할 수 있으며 데이터의 일관성과 신뢰성이 매우 높다. 하지만 그만큼 스키마를 미리 정의하기에 데이터 구조를 변경하기 어렵다. 또한 수평적 확장이 구조적으로 어렵고 JSON, XML 등의 비정형 데이터를 저장하고 처리하기에 비효율적이다...

CS/Database System 2025.08.19

[Information Retrieval] 정보 검색의 꽃! - Scoring, Term Weighting, The Vector Space Model

정보검색의 꽃. 굉장히 중요한 부분이다!이번 챕터의 Term frequency, Tf-idf ranking, Vector space model은 반드시 시험에 나오니 잘 익혀두자.1. Ranked retrieval기존에는 단어가 포함된 문서를 찾는 boolean retrieval을 다루었다. 그런데 어떤 단어는 많은 관련이 있고 어떤 단어는 등장하기만 할 수 있다. 중요도가 없는 것이다. expert users, application에게는 boolean retrieval이 좋을 수 있다. 전문가는 &, |를 잘 설정해서 관련된 문서의 개수를 잘 조절할 수 있지만 일반 사용자들에게는 불가능하다.예를 들어 변호사는 오래 걸리더라도 관련된 모든 정보를 다 봐야 하지만일반 사용자들은 1000개가 넘는 문서를 다..

CS/Information Retrieval 2024.12.15

[Database System] Basic SQL

RDBMS가 수학에 기반한 모델이기에 견고하게 구성되어 있고 모델 뿐 아니라 모델을 잘 활용할 수 있는 인터페이스가 중요했다. 그 인터페이스 중 SQL로 수렴이 됐고 잘 만들어진 언어이다. SQL은 술어논리로 이루어져 있는데 그래서 닫힘 성질을 가지고 있다. operation을 수행했을 때 input과 output이 같은 집합에 속해있다는 것이다. 예를 들어 어떤 집합에 SQL 연산을 수행하면 결과 또한 집합이다.이러한 닫힘 성질 덕분에 operation set 하나만 디자인하면 된다. 만약 결과가 집합이 아니라면 그 결과에 따른 다른 operation set을 만들어야 한다.1. SQL Data Definition and Data TypesSQL 에서는 Table, Row, Column 용어를 사용하고..

CS/Database System 2024.12.08

[Database System] The Relational Data Model and Relational Database Constraints

이제 위에서 만든 ER 다이어그램을 테이블로 만들기 전에 Relational Data Model과 RDB가 가지고 있는 제약사항을 알아야 한다.1. Relational Model ConceptsRelation에 대한 개념부터 짚고 넘어가자. Relation을 원래 table로 생각을 했지만 이해를 쉽게 하기 위해 table로 생각한 것이지 원래 Relation은 집합을 근본으로 한다. 집합을 근본으로 하는 만큼 정교한 수학을 기반으로 하기에 Relation 개념은 견고하다.Relational Model Concepts은 Dr.E.F.Codd에 의해 집합을 근거로 고안된 수학적인 컨셉이다. 이 컨셉은 구현에 관해서는 전혀 신경쓰지 않고, 이 컨셉을 구현할 때 table을 이용해서 구현하게 된 것이다.Inf..

CS/Database System 2024.11.27

[Information Retrieval] Index Compression - Heaps' law, Zipf's law, Dictionary compression, front coding, Postings compression, gamma code

1. Compression정보검색에서의 압축은 다음과 같은 의미를 가진다.dictionary의 크기를 줄이는 것은 메인 메모리에 많이 올릴 수 있다는 것이다.posting file을 줄이는 것은 disk space를 줄이고, disk를 읽는 시간을 줄이는 것이다.Lossy손실이 있는 압축이다.소문자로 바꾸거나 stemming, stop word 제거하는것 등이다.Lossless손실이 없는 압축이다.zip 등이다.딕셔너리를 디스크에 올려놓는게 굉장히 빠르고 좋은데 너무 크다. 따라서 압축을 해야 한다. 압축을 하는 경우 압축을 푸는 시간이 들긴 하지만 디스크에 접근하는 것 보다 훨씬 빠르다.2. Term statistics통계를 다시 보자.number를 제외하거나 case folding, stopword ..

CS/Information Retrieval 2024.11.26

[Information Retrieval] Index Construction - BSBI, SPIMI, Distributed indexing (Map Reduce), Dynamic Indexing(Logarithmic merge)

1. IntroductionHardware basics하드디스크보다 메모리가 훨씬 빠르다.그러나 메모리의 양이 매우 적기에 양을 나누어서 메모리에 넣고, external sort를 수행해서 inverted index를 만드는 방식으로 작동하게 된다.디스크에서 정보를 찾는 seek time은 굉장히 느리다. 참고로 seek는 트랙을 찾는 것이고 섹션을 찾는 rotate는 비교적 빠르다.모든 operation을 디스크를 거치지 않고 메모리에서 하면 굉장히 빠르다.한 번 트랙을 찾으면 최대한 많이 읽어오는 것이 유리하고 그래서 block 단위로 저장하는 것이 좋다.Fault tolerance는 비싸다.RCV1 collection정보 검색을 테스트하기 위해 원래 셰익스피어의 희곡을 사용했는데 양이 너무 적었다...

CS/Information Retrieval 2024.11.25

[ServerProgramming] Make

1. makemake는 여러 개의 소스코드 그룹을 관리하는 툴이다.make를 강력하게 추천하는 이유는 incldue 로 다른 로컬 헤더파일을 포함하거나, 복잡한 구조를 쉽게 관리할 수 있다.특히 여러 개의 소스코드 중 딱 하나만 수정한 경우 수정된 파일만 새로 컴파일하여 굉장히 효율적으로 소드코드 그룹을 관리할 수 있다. make는 Target, dependency, command로 이루어져 있다. File Foramt은 다음과 같다.target: dependency[tab] commandmake 를 입력하면 Makefile을 실행하고, target을 생성한다. target 을 빌드할 때 필요한 파일들이 dependency에 적혀있고, target을 생성하기 위해 실행할 명령어가 command에 적히게 ..

CS/ServerProgramming 2024.10.08

[ServerProgramming] Vi Editor, GCC

1. Vi EditorVi Editor는 두 모드로 나뉜다.Command mode : vi를 실행하면 명령 모드로 들어와진다.Input mode : i를 입력해서 Input mode로 진입할 수 있다. 인풋 모드에서 text를 작성할 수 있다. esc 키를 눌러서 명령 모드로 돌아갈 수 있다.How to exit from vi (command mode):q : 종료:q! : 저장하지 않고 종료:wq : 저장하고 종료Moving Aroundh : leftl : rightj : downk : upEntering Texta : insert 모드로 가는데 커서 뒤에서부터 입력i : insert 모드로 가는데 커서 앞에서부터 입력o : insert 모드로 가는데 현재 커서 아래 줄에 새로운 줄 생성해서 입력Edi..

CS/ServerProgramming 2024.10.07

[ServerProgramming] UNIX의 BASIC COMMAND를 배워보자!

1. Shell쉘이란 운영체제 상에서 다양한 운영체제 기능과 서비스를 구현하는 인터페이스를 제공하는 프로그램BASH : 거의 모든 리눅스 배포판에서 사용하는 쉘. 가장 많고 가장 범용적이다.CSH : C 스타일 문법의 쉘KSH, DASH, TCSH 등..SH : 스크립트 용으로 많이 사용됨.shell commands의 기본 규칙은 다음과 같다.command --option xxxcommand -option xxx빈칸이 구분자로 사용된다. 빈칸을 구분자가 아닌, 명령에 포함하려면 " 또는 ' 를 사용하면 된다.command —help , man command: 옵션 등 도움말2. 기본 명령어로그인/로그아웃명령 기능 주요 옵션 예제ssh유닉스 시스템에 접속logout, exit유닉스시스템 접속해제passwd..

CS/ServerProgramming 2024.10.05

조준화의 오류정정

CS 47

티스토리툴바

« 2026/07 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31