본문 바로가기

시뮬레이션 기반 사이언스29

[연구 보고서 자동화] 파이썬(Python) 기반 논문 및 랩미팅용 PDF 결과 보고서 자동 생성 워크플로우 (FPDF 활용) 지난 10편의 시리즈를 통해 우리는 다중 물리 시뮬레이션 로그 파일에서 데이터를 추출하고, 머신러닝 예측을 수행하며, SciPy를 이용해 통계적 유의성(p-value)이 포함된 최종 결과 표(Table)를 생성하는 과정까지 완벽하게 자동화했습니다. 하지만 연구자의 업무는 여기서 끝나지 않습니다. 도출된 그래프와 표를 마이크로소프트 워드(Word)나 파워포인트(PPT)에 일일이 복사해서 붙여넣고, 서식을 맞춰 랩미팅(Lab meeting) 자료나 주간 보고서를 작성하는 데 또다시 막대한 시간이 소모됩니다. 만약 시뮬레이션 파라미터가 수정되어 처음부터 다시 계산해야 한다면, 이 수작업 문서 작업도 처음부터 다시 해야 하는 끔찍한 상황이 발생합니다. 이번 포스팅에서는 파이썬의 FPDF 라이브러리를 활용하여 데.. 2026. 4. 23.
[연구 데이터 분석] 파이썬 Pandas와 SciPy를 활용한 논문용 통계 분석 및 결과 표(Table) 자동 생성 스크립트 지금까지 우리는 시뮬레이션의 병렬 처리, 로그 파일에서의 데이터 파싱, 그리고 웹 대시보드 구축까지 계산 화학 및 신소재 연구의 굵직한 파이프라인을 자동화했습니다. 이제 연구의 대미를 장식할 마지막 단계가 남았습니다. 바로 추출된 수백, 수천 개의 데이터 포인트를 바탕으로 '통계적 유의성(Statistical Significance)'을 검증하고, 논문에 즉시 삽입할 수 있는 깔끔한 '결과 표(Table)'를 만드는 작업입니다. 그래핀(Graphene) 전계효과트랜지스터(GFET)의 민감도 분포나 머신러닝이 예측한 수백 개 금속유기골격체(MOFs)의 오차율을 엑셀(Excel)에서 일일이 수식으로 계산하는 것은 비효율적일 뿐만 아니라 재현성을 해치는 주요 원인입니다. 이번 포스팅에서는 파이썬의 Pandas.. 2026. 4. 22.
[연구 플랫폼 구축] 파이썬 Streamlit을 활용한 시뮬레이션 파일 변환 GUI 웹 대시보드 만들기 지난 8편의 시리즈를 통해 우리는 다중 물리 시뮬레이션의 최적화부터 파이썬(Python)과 ASE 라이브러리를 이용한 데이터 전처리 자동화까지 복잡한 공학적 워크플로우를 하나씩 정복해 왔습니다. 하지만 아무리 뛰어난 자동화 스크립트라도 검은 화면의 터미널에서 명령어를 입력해야 한다면, 프로그래밍에 익숙하지 않은 실험실의 동료들이나 외부 협업 연구자들이 이를 활용하기에는 무리가 있습니다. 연구의 효율화는 나 혼자만의 생산성을 높이는 것을 넘어, 누구나 쉽게 내가 만든 도구를 사용할 수 있는 '환경'을 구축할 때 완성됩니다. 이번 글에서는 복잡한 웹 개발 지식(HTML/CSS/JS) 없이도 단 몇십 줄의 파이썬 코드만으로 전문가 수준의 연구용 웹 대시보드를 구축할 수 있게 해주는 **Streamlit(스트림.. 2026. 4. 22.
[파이썬 실전] 수백 개의 분자 및 결정 구조 파일 확장자 일괄 변환 자동화 스크립트 (.xyz, .cif, POSCAR) 지난 포스팅에서는 계산 화학과 신소재 연구의 퀄리티를 높여주는 3대 시각화 프로그램(Avogadro, VESTA, PyMOL)의 활용법을 알아보았습니다. 하지만 이 프로그램들을 능수능란하게 다루기 전에 연구자들이 반드시 넘어야 할 산이 있습니다. 바로 '파일 포맷(Format)의 불일치'입니다. 아보가드로는 3차원 좌표만 있는 '.xyz' 파일을 주로 다루지만, VESTA는 주기적 경계 조건(PBC)이 포함된 '.cif' 파일을 선호하며, 실제 슈퍼컴퓨터에서 VASP 시뮬레이션을 돌리기 위해서는 'POSCAR'라는 특수한 텍스트 포맷이 필요합니다. 머신러닝으로 생성해 낸 수천 개의 새로운 분자 구조 파일(.xyz)을 시뮬레이션용 포맷으로 마우스 클릭을 통해 일일이 바꾸는 것은 물리적으로 불가능합니다. 이.. 2026. 4. 22.
[연구 시각화] 계산 화학 및 신소재 연구를 위한 3D 분자 구조 시각화 무료 프로그램 탑 3 완벽 비교 (Avogadro, VESTA, PyMOL) 지난 포스팅에서는 파이썬(Python)과 정규표현식을 활용하여 수만 줄의 텍스트 로그 파일에서 단일점 에너지(Single Point Energy) 등의 핵심 수치를 1초 만에 추출하는 워크플로우를 구축해 보았습니다. 하지만 인간은 시각적인 동물이며, 논문의 심사위원(Reviewer)들 역시 마찬가지입니다. 아무리 훌륭한 계산 결과를 얻었다고 하더라도, Advanced Healthcare Materials와 같은 고분자 및 바이오 융합 분야의 최상위 저널에 연구를 게재하기 위해서는 데이터의 물리적 의미를 직관적으로 전달하는 '고해상도 3D 구조 시각화'가 필수적입니다. 이번 글에서는 계산 화학 및 반도체 화학공학 소재 연구자들이 논문 피규어(Figure) 제작을 위해 가장 널리 사용하는 3대 무료 시각화 .. 2026. 4. 22.
[파이썬 실전] 양자 화학 시뮬레이션(ORCA/VASP) 로그 파일에서 핵심 데이터 자동 추출하기 (정규표현식 활용) 이전 시리즈들에서 우리는 계산 화학 및 다중 물리 시뮬레이션의 효율을 극대화하기 위한 파이썬(Python) 기반의 워크플로우 자동화 개념을 살펴보았습니다. 이번 포스팅부터는 실제 연구 현장에서 즉시 복사하여 사용할 수 있는 실전 파이썬 스크립트를 하나씩 리뷰해 보겠습니다. 첫 번째 주제는 밀도범함수이론(DFT) 시뮬레이션 직후 가장 먼저 마주하게 되는 '데이터 파싱(Data Parsing)' 작업입니다. ORCA나 VASP와 같은 양자 화학 프로그램이 뱉어내는 방대한 텍스트 로그 파일에서 우리가 원하는 정확한 수치만 1초 만에 추출하여 엑셀(CSV) 파일로 정리하는 강력한 자동화 코드를 소개합니다.1. 수작업 데이터 수집의 한계와 방대한 출력(Output) 파일의 구조촉매의 반응성이나 금속유기골격체(MO.. 2026. 4. 21.