Blog

DQN과 A2C network를 활용한 CartPole 강화학습 훈련과정 및 code

목차

01 Cartpole environment
02 DQN algorithm & code
03 A2C algorithm & code

본문내용

OpenAI gym의 CartPole은 카트 위에 막대기가 고정되어 있고 막대기는 중력에 의해 바닥을 향해 자연적으로 기울게 되는 환경을 제공한다. CartPole의 목적은 카트를 좌, 우로 움직이며 막대기가 기울지 않고 서 있을 수 있도록 유지시켜 주는 것이 목적인데, 강화 학습 알고리즘을 이용하여 막대기를 세울 수 있는 방법을 소프트웨어 에이전트가 스스로 학습할 수 있도록 한다. 다음은 CartPole 환경에서 사용되는 observation, action, reward, episode의 시작과 종료에 대한 설명이다.
Observation: cart의 현재 위치, cart의 속도, pole의 기울기, pole의 속도를 의미한다. Action: 오른쪽(1) 또는 왼쪽(0) reward: 매 타임스텝마다 +1씩 보상을 받는다. Episode Termination: 막대가 중심에서 2.4deg이상 기울어지거나, 멀리 떨어지면 종료된다.
step function을 통해 랜덤한 움직임에 대한 action을 한번 수행하고, action이 실행된 이후의 상태(observation)와, 보상(reward), 막대가 쓰러졌는지의 여부(done) 등의 정보가 반환된다.
Code:
코드는 제가 직접 작성한 것이 아님을 밝힙니다. 산업정보시스템전공 딥러닝 수업을 듣고 프로젝트도 수행했던터라 딥러닝과 강화학습을 조합한 알고리즘에 자연스럽게 관심이 생겼습니다. 따라서 실제 구현된 DQN network와 A2C(Advantage Actor-Critic) network의 코드를 실행시키고 분석했습니다.

출처 : 해피캠퍼스

1월 2, 2026
Data Similarity and Distance를 측정하는 measure

목차

1. Text Similarity Measures
2. Temporal Similarity Measures
3. Graph Similarity Measures
4. Supervised Similarity Functions

본문내용

– Similarity between Two Graphs
그래프간 유사도 계산에서 어려운 요인은 많은 node들이 같은 레이블을 가지고 있는 것이다. 이 문 제는 하나의 분자에 같은 원소가 존재하는 화학분야 같은 곳에서 발생한다. 이것을 NP-hard라고 알 려진 graph isomorphim problem(동형이질: 모양은 같은데 성질은 다른 것)이라고 부른다. 따라 서 다양한 알고리즘들이 제안되었다.

-Maximum common subgraph distance: 두 그래프가 큰 subgraph를 가질 때 유사하다고 고려한다.
-Substructure-based similarity: 공통의 substructures의 수를 세어서 유사도를 측정한다.
-Graph-edit distance: string-edit distance와 비슷한 방식으로 하나의 그래프를 목표로 하는 그래프에 일치시키기 위해서 얼마나 많이 edit을 해야하는지에 따라서 유사도가 결정된 다. 하지만 규모가 큰 그래프에서는 적용시키기가 어렵다.
-Graph kernels: 비슷한건 비슷하게, 다른 것은 더 다르게 만드는 kernel function을 통해서 유사도를 측정한다.

4. Supervised Similarity Functions
분류문제에 적용하는 function으로 높은 value를 가질수록 비유사성이 커지므로 distance function 이다. 특징은 이전의 measure들은 사용자의 도움이 없이 유사도를 측정했지만, 이것은 특성의 관련 성 또는 distance function을 결정할 때 도메인 지식에 크게 의존한다. 도메인 지식에 따른 feedback은 아래와 같이 표현된다.

각 feature마다 feedback을 바탕으로 결정된가중치..

<중 략>

출처 : 해피캠퍼스

1월 2, 2026
Data Preparation

목차

1. feature extraction and portability
2. data cleaning
3. data reduction and transformation

본문내용

1. feature extraction and portability
feature extraction은 다양한 출처(센서, 이미지, 웹 기록, 침입감지, 문서 등)에서 데이터를 얻는 것을 말한다. portability는 다른 유형으로 데이터를 변환하는 것을 말한다.
Portability Example Discretization: 가장 흔하게 사용되는 변환이며, 정보를 일부분 소실하는 것이 특징이다. 문제점은 일정하지 않은 간격으로 데이터들이 불일치하게 분배되어 있다는 것이다. ① Equi-width ranges: 각 범위 [a,b]는 b-a와 같은 방식으로 선택 되고, 불일치하게 분배되어 있는 데이터에는 적용되지 않는다. [최솟값, 최댓값]은 φ정도의 일정한 길이로 나누어 진다. ② Equi-log ranges: 각 범위 [a,b]는 log(b)-log(a)와 같은 방식으로 선택된다. 이러한 방법의 범위 선택은 기하학적으로 크기가 증가하는 효과가 있다. ③ Equi-depth ranges: 각 범위는 동일한 수의 기록을 갖고, 각 범위에 세분화를 제공하는 것을 말한다. Binarization: categorical한 성질을 binary한 형태로 바꾸고 binary된 데이터에 대해서 numeric algorithms를 사용한다. φ속성 중 하나는 1값을 가지고, 나머지는 0값을 가진다. LSA: 차원이 높아지면 공간의 크기는 기하급수적으로 커져서 데이터 분포가 sparse하게 되고 성능은 기하급수적으로 떨어지는 것을 차원의 저주라고 부른다. 따라서 LSA는 낮은 차원에서 데이터를 sparse하지 않은 표현으로 변환하는 것을 말한다. 변환 후 스케일링을 적용하기도 하는데, 스케일링은 다양한 길이의 문자들을 균일하게 변환하는데 필요하다.

출처 : 해피캠퍼스

1월 2, 2026
A+ 지주막하출혈케이스 입니다.

목차

Ⅰ. 서론
A. 연구의 필요성 2
B. 연구대상 및 방법 2

Ⅱ. 본론
A. 문헌고찰
1. SAH의 정의 2
2. SAH의 원인 3
3. SAH의 병태생리 3
4. SAH의 진단방법 3
5. 증상 3
6. 치료 3
7. 간호 4
B. 간호과정
1. 간호사정
(1) 자료수집 4
(2) 자료요약 12
(3) 문제중심 기록지 작성 12

Ⅲ. 느낀 점 15

Ⅳ. 참고문헌 15

본문내용

I. 서론

A. 연구의 필요성
현대 사회로 발전하면서 교통사고, 산업 재해, 스포츠 손상 등의 각종 사고의 증가로 외상성 지주막하 출혈은 뇌혈관질환 사망의 절반이상을 차지한다. 미국에서는 일 년에 인구 10만 명당 10~28명꼴로 사망하며 대개 55~65세 사이에 호발 한다. 지주막하출혈에서의 문제는 지연성 병변이 발생하거나 병변이 커져 예후가 불량하기 때문에 적절한 치료와 간호의 필요성이 강조되고 있으며, 머리에 외상을 입은 후 별 증상이 없어서 소홀할 수 있으므로 더욱 연구의 필요성이 느껴졌다.

B. 연구대상 및 방법
1. 연구대상선정 동기
처음 실습 한 날 낯선 분위기 속에 제일 처음 보인 환자는 간호사 스테이션 바로 앞에 위치한 SAH환자였다. 가래로 인하여 가래 끓는 소리가 자주 들려 suction을 위해 자주 보게 되는 환자였고, 중환자실의 절반은 뇌혈관 손상 환자였으므로 SAH란 어떤 병인지 그에 따른 간호에 대해 자세히 알고 싶었기 때문에 이 환자를 케이스로 잡았다.

2. 연구 방법
실습하는 기간 동안 이 환자의 상태를 매일 사정하고 어떤 약을 투약 받고 있는지 알아보았고 간호사 선생님들께서 어떤 간호를 하는지 항상 유심히 관찰하였다.
이 환자에게 달려있는 생명장치인 의료도구들에 대해서도 많은 관심을 가지며 어떤 역할을 하는지 알려고 노력하고 조사하였다.

II. 본론
A. 문헌고찰
1. SAH의 정의
사람의 뇌 실질을 감싸고 있는 뇌막은 경막, 지주막, 연막의 3종으로 구분되는데, 이 중 중간에 있는 막이 마치 거미줄 모양과 같다고 해서 지주막 또는 거미막이라 하고, 가장 안쪽에 있는 연막과의 사이에 있는 공간이 지주막하 공간이다. 이 지주막하 공간에 출혈이 일어나는 질환을 뇌 지주막하출혈이라 한다.

출처 : 해피캠퍼스

1월 2, 2026
비교 광고의 사용에 관한 찬반논란에 대하여

목차

Ⅰ. 서론

Ⅱ. 본론
1. 비교광고의 사용에 관한 찬반 논란 기술
2. 비교광고효과를 극대화할 수 있는 광고전략

Ⅲ. 결론

IV. 참고문헌

본문내용

Ⅰ. 서론

사업가들에게 ‘광고’란 불가결한 요소일지도 모른다. 특히 오늘날에는 SNS와 같은 온라인 마케팅 시장이 발달하면서 어느 시장에 침투하여도 레드오션이다. 특히 모두가 좋아하는 대중적인 브랜드가 탄생하는 일은 점점 어려워지고 있다. 개인 관심사와 취향은 점점 더 세분화되고 있는데, 대중적인 브랜드는 태생 자체가 ‘표준화’에 목적을 두고 있기 때문이다.
이러한 마케팅 시장에서 살아남기 위해서는 비교 광고를 활용할 수 있다. 본 과제에서는 비교광고의 장단점과 대표적인 전략에 대해 다뤄보겠다.

Ⅱ. 본론

1. 비교광고의 사용에 관한 찬반 논란 기술

1) 비교광고 찬성의 입장
소비자들은 비교광고를 통해 오히려 몰랐던 정보를 알게 됨으로써 흥미를 느끼게 된다.

출처 : 해피캠퍼스

1월 2, 2026
3D 프린팅을 활용한 거푸집 실현방안 및 시각적 모델링

목차

1. 3D 프린팅
1) 3D 프린팅 재료
1) 통상적 재료
2) 건설적합, 친환경적 재료
2) 표면처리

2. 역위된 거푸집을 정위하는 방법
1) 크레인 방식과 이에 근거한 출력공정
2) 수중양생 방식

3. 요약

본문내용

기존 거푸집의 설치비용. 시간. 안전사고를 줄이며 비정형 건물 표현의 제약이 없는 3D 프린팅 거푸집에 대해 생각해봤다. 우리의 거푸집은 일체형으로 콘크리트 타설 후에 해체작업이 필요가 없다. 거푸집 설치 전에 미리 철근 배근이 모두 완료된 상태라 가정 후, 거푸집이 3D 프린팅으로 출력되면 정해진 위치에 맞춰 거푸집을 끼워 넣는 단순한 방법으로 철근 배근 문제를 해결했다. 벽체 거푸집뿐만 아니라 슬래브 거푸집까지 한 번에 출력하길 원했기 때문에 슬래브 거푸집이 바닥면이 되는 거꾸로 출력하는 방식을 채택했다. 출력재료로는 초기에는 콘크리트로 채택했으나. 자료조사를 통해 친환경적인 바이오콘크리트. 바이오폴리머 재료 등으로 선택의 폭을 넓혔다. 출력물의 표면처리 해야 할 부분은 외면과 바닥면이다. 외면은 외장재로, 출력물의 바닥면이 닿는 출력판은 박리제를 스프레이 방식으로 도포할 계획이다. 역위된 거푸집을 기초에 정위시키기 위한 방법으로 크레인 방식과 수중양생 방식을 제시해보았고, 정위된 거푸집을 고정할 방법으로는 출력물 측면에 구멍을 뚫어 블록처럼 끼워 넣어 고정하도록 했다. (이하 생략)

출처 : 해피캠퍼스

1월 2, 2026
지레의 원리와 인체지레

목차

Ⅰ. 지레란?

Ⅱ. 본론
1. 원리
2. 종류
3. 인체지레 원리

Ⅲ. 결론

본문내용

Ⅰ. 지레란?

아르키메데스라는 고대 수학자에 의해 처음 정의 된 지렛대의 원리는 지레라 칭하는 막대와 이것을 받치는 받침점과 막대에 힘이 가해지는 부분 힘점, 그리고 지레가 움직여 물체가 움직이게 되는 작용점으로 구성이 되어있다고 할 수 있습니다.
즉 막대와 받침대를 이용하여 물체를 움직이게 하는 것입니다. 이 장치를 이용하면 물건을 움직이게 하기 위해 필요한 적은 힘으로 방향을 바꿀 수 있습니다.

Ⅱ. 본론

1. 원리

지렛대 원리에 대해 정의를 한 아르키메데스는 가한 힘에 작용점부터 받침점까지의 거리를 곱한 것은 물건의 무게에 물건부터 받침점까지의 거리를 곱한 것과 같다고 결론을 내렸습니다.

출처 : 해피캠퍼스

1월 2, 2026
체육과 유사한 개념에 대하여 조사(레크레이션)

목차

Ⅰ. 서론

Ⅱ. 본론
1. 레크레이션 어원 및 해설
2. 레크레이션 정의
3. 레크레이션의 기능 및 역할

Ⅲ. 결론

본문내용

레크레이션은 역사적으로 인간과 함께 존재를 하고 있었습니다. 사회가 도시화, 산업화, 노동자들의 시간이 줄어드는 등 변화를 맞이하며 최근 들어서 중요성이 강조되기 시작했습니다. 자유시간에 대한 문제가 발생하며 자유시간과 노동시간간의 변화가 발생하게 됐습니다. 국가에 따라 처해진 상황이 다르고 국제적으로는 1919년 국제노동기구가 탄생되면서 중요성이 강조됐고 이 시점을 기준으로 레크레이션에 있어 새로운 시각을 갖게 됐습니다. 한국은 광복 이후 레크레이션이 일반적으로 인식이 생기게 됐습니다.
노동과 관련하여 자유 시간에 관한 문제는 중요하게 대두가 됐습니다. 레크레이션도 인간 본연 중심으로 관념이 작업 중심에서 변화했습니다. 시설이 늘어 나고, 관련 정책이 만들어지고 이를 이행하며 관련 교육에 대해 다시 검토를 해야 하는 등 해결해야 되는 것이 있습니다.

출처 : 해피캠퍼스

1월 2, 2026
프로스포츠 구단을 1개 선정하여 해당 구단을 SWOT분석하여 다른 구단에 대한 경쟁전략을 수립

목차

Ⅰ. 서론

Ⅱ. 본론
1. SWOT분석 개요
2. 한화이글스 SWOT 분석
3. 한화이글스 SWOT 분석 전략

Ⅲ. 결론

본문내용

SWOT분석은 하나의 기업이 강점, 약점, 기회, 위협 등을 조합하여 통합 전략을 도출하기 위함이 목표인 대중적인 분석 요법입니다. 외부 환경에 대해 분석을 하고 내부역량을 파악하면서 내적 요인으로 강점과 약점, 외적인 요인으로 기회와 위협을 종합하여 분석하게 됩니다. 이런 요인들을 전략적으로 분석을 하여 해당 기업의 전략적인 측면을 찾아내고 해결방안 또는 추진을 할 수 있는 전략을 만드는 것이 목표입니다.
SWOT분석은 조합에 따라 4가지로 구분을 하게 됩니다.
(1) 강점-기회전략(S-O)
기업이 가지고 있는 장점을 이용해 외부에 있는 기회를 이용하는 전략
(2) 강점-위협전략(S-T)
외부에 있는 위협에 대해 기업의 강점을 이용해 극복하는 전략

출처 : 해피캠퍼스

1월 2, 2026
스프츠 수행에서 집중력, 자신감을 높이기 위한 전략

목차

Ⅰ. 서론

Ⅱ. 본론
1. 집중력 훈련
2. 자신감 훈련

Ⅲ. 결론

본문내용

스포츠 경기에서 결과가 나눠지는 것은 개인 운동능력 또는 체력인 부분이 어느 정도 비중을 차지한다고 할 수 있습니다. 하지만 단순히 선수마다 운동능력과 체력만 중요한 것은 아니라고 할 수 있습니다. 심리적인 요소도 최종 결과에 영향을 미칠 수 있습니다.
올림픽이나 최근 열린 아시안게임에서 볼 수 있듯 메달이 유력하다고 해서 꼭 금메달을 따른 것은 아니었습니다. 배드민턴 국가대표인 안세영선수는 세계랭킹 1위로 금메달이 유력하다고 예상을 했지만 결승전 도중 예상하지 못한 무릎 부상이 발생했지만 정신력으로 위기를 기회로 평소보다 더 집중을 하여 금메달이라는 결과를 차지했습니다. 또한 세계 최강이라고 할 수 있는 양궁 종목의 경우 높은 집중력이 필요하기 때문에 이를 훈련하기 위해 실제 대회장 환경에서 소음까지 더하여 집중력을 향상시키는 훈련을 진행한다고 합니다.

출처 : 해피캠퍼스

1월 2, 2026