현업 6년차 학사 나부랭이 ㅈ문가의 지식이니 틀린 부분이 있을수 있읍니다
구글에 HCI(hot carrier injection), NBTI(negative bias temperature instability), Electromigration 등에 대한 내용을 검색해보면 자세한 설명이 나옵니다
아니면 transistor aging 으로 검색해보셔도 좋습니다
우선 알아둬야할 것은, 대부분의 반도체 칩은 한번쯤 들어봤을 MOSFET(Metal-Oxide-Semiconductor Field Effect Transistor)를 사용한다
다른 트랜지스터도 그렇지만 보통 소스, 드레인, 게이트, 바디로 구성되는 MOSFET은 기본적으로 메탈 게이트에 걸리는 전압이 일정 기준을 넘었냐 넘지 않았냐에 따라 on(전류가 흐르는가)/off(흐르지 않는가)가 되는 스위칭 소자라고 보면 된다
한번쯤 들어봤을 핀펫FinFET은 MOS의 모양을 지느러미(Fin) 형태로 한 것이고,
차세대 공정으로 이야기가 나오는 GAA(Gate-all-around)FET의 경우 MOS로 아예 채널을 감싸버린 케이스라고 보면 된다
PMIC(전력 제어 칩) 같은 곳에서는 BJT(Bipolar Juction Transistor)를 사용하는 경우도 많은데 일단 이건 일단 둘째치고,
반도체 칩에 있는 반도체 회로는 이 수많은 트랜지스터와 이 트랜지스터를 연결하는 금속 선로를 가지고 있다.
당장 기본적인 셀 중 하나인 입력이 2개인 NAND2만 해도 최소 트랜지스터 4개 묶음이다.
고작 셀 하나가 이 정도이니 현 세대 반도체 칩 하나에 트랜지스터 수십억개가 들어가니 어쩌니 하는 것.
여하튼 잡설은 치우고 대부분의 반도체 칩의 단면도와 설계도(일반적으로 반도체 레이아웃, GDS로 불리는 그거)는 아래 그림과 같다.
(1) 반도체 칩의 단면도
(2) 반도체 칩 설계 프로그램 화면(ICC라는 대표적인 place & route 프로그램)
(화면 깨진거 아님)
(존나 만날 팅겨대서 개빡치는 툴임 ㄹㅇ)
반도체칩 수명 이야기하는데 이 두개를 왜 이야기하냐면
반도체 칩 수명에 관해서 1. 트랜지스터 자체의 특성 열화와 2. 금속 선로의 열화 두가지 이야기를 하려고 하기 때문이다
1. 트랜지스터 특성 열화
트랜지스터는 기본적으로 on/off를 제어하는 스위치인데 (물론 아날로그 회로에서는 다른 특성을 활용하기도 한다)
게이트에 걸리는 전압이 일정 이상 되면 채널이 형성되고, 전자/정공(이 둘을 합쳐 캐리어Carrier라고 한다)이 채널을 통과하여 전류가 흐르게 되는데, 이렇게 채널이 형성되냐 안되냐가 트랜지스터의 on/off라고 보면 된다.
이 on/off의 기준점이 되는 값을 문턱 전압(Threshold Voltage, 일반적으로 Vth로 표기한다)이라고 하며,
트랜지스터의 속도는 (공급 전압 - 문턱 전압)에 영향을 받는다.
아주 정확한 설명은 아니겠지만, 대충 설명하면
트랜지스터의 속도가 빠르다
= 입력이 바뀐 후 트랜지스터로 구성된 연산 회로의 출력이 바뀌는 시간이 짧다
= 더 짧은 시간 안에 더 많은 연산을 하고 그 값을 주고 받을 수 있다
= 클럭을 더 높일 수 있다
= 성능을 더 높일 수 있다 정도로 이해하면 된다.
(물론 전압이 너무 높아 속도가 빠르면 그건 그거대로 문제가 된다. 클럭과 셋업/홀드 타임에 대해 검색해보면 나온다)
그런데 트랜지스터가 동작할 때, 고전압/고온 등 여타 이유로 캐리어가 가지는 에너지가 너무 강해질 경우,
본래라면 채널따라서 소스 - 드레인으로 가야하는 캐리어가 뜬금없이 게이트 쪽으로 튀어올라가거나,
멀쩡한 놈과 충돌해서 전자를 추가로 생성(Impact Ionization)하는 등, 여하튼 캐리어가 산화막(MOS에서 Oxide)에 갇히는 경우가 있다.
(아래 그림)
이렇게 산화물에 갇힌 캐리어들을 트랩(Trap)이라고 하는데, 말 그대로 함정이 되어서 채널 형성을 방해하는 역할을 한다.
이는 곧 문턱 전압 값이 높아지는 결과를 낳는다.
(산화막에 캐리어가 존재 => 게이트에 전압이 인가될 때 게이트 - 소스 간 전압 차이가 작아짐 => 문턱 전압 증가)
대충 스위치에 먼지 껴서 뻑뻑해진다고 이해하면 얼추 맞아 떨어진다.
위에서 말했지만 문턱 전압이 높아지면 같은 공급 전압 조건 하에서 트랜지스터의 속도가 떨어지고.
이는 곧 트랜지스터의 성능이 저하되는 것을 말한다.
이게 누적되면 결과적으로 이전과 같은 전압에서 동일한 성능으로 동작할 수 없게 되는 셈.
이러한 현상은 보통
1. 고온에서 전자가 가지는 에너지가 커질 경우(Hot Carrier Injection, HCI),
2. 고전압으로 강해진 전기장으로 전자가 가지는 에너지가 큰 경우(Negative Bias Tempereature Instability, NBTI)
등의 원인으로 발생한다.
반도체에서 고온 고전압을 피하는 이유 중 하나가 이러한 현상을 방지함에 있다.
2. 금속 선로 열화
중~고등학교 과학 지식으로는 회로의 금속 선로에는 저항이 존재하긴 하지만 그 값이 무시할 정도로 작기 때문에 무시하고 계산을 했을 것이고
실제로 충분히 두꺼운 금속 선로에 대해서는 이는 틀린 말이 아니다
그런데 위에서 말했듯 반도체 칩에 트랜지스터가 수 십 억개가 그 작은 공간에 치밀하게 들어가 있다.
회로를 구성하기 위해서 이 수많은 트랜지스터를 기능에 맞춰 선로를 구성하여 연결해야하고, 아무리 회로 최적화를 잘한다고 해도 궁극적으로 더 작은 공간에 더 많은 트랜지스터를 때려박기 위해서는 금속 선로의 두께를 줄일 수 밖에 없다.
실제로 첨단 공정에서 반도체 회로의 금속 선로의 단위 선폭/두께는 수십 ~ 수백 나노미터 단위에 지나지 않고, 인접한 금속 선로와의 거리도 이와 비슷하다.
이로 인해 금속 선로의 저항과 금속 선로 사이에서 생성되는 기생 커패시터는 절대로 무시할 수 없는 요소로 다가온다.
현재 반도체 설계하는데 선로 구성에 따라 셀 딜레이(트랜지스터 자체의 출력이 바뀔 때 소요되는 시간)보다 넷딜레이(신호가 금속 선로를 통과하면서 생기는 딜레이)가 큰 경우도 있는 마당이다.
그런데 이때, 금속 선로를 전자가 통과하다보면 얘들이 얌전히 통과하면 좋은데 금속 원자들을 치고 지나간다
(중~고등학교 시간에 배운 그 러더포드 실험 생각해보면 된다)
이 과정에서 금속 원자들의 배치가 변경되는데, 이를 전기전진(Elctromigration, 일렉트로마이그레이션, 이하 EM)이라고 한다
(아래 사진)
(대형 IP벤더/EDA 툴 제조사인 시높시스 사의 EM에 대한 아티클이니 관심 있으면 읽어보자
https://www.synopsys.com/glossary/what-is-electromigration.html )
이게 뭐 충분히 두꺼운 금속 선로면 원자 좀 이동된다고 문제가 생기지는 않겠지만
문제는 위에서 말했다시피 반도체 회로는 수십 ~ 수백 나노미터 단위의 금속 선로로 구성되어 있다
일렉트로마이그레이션으로 발생한 금속 선로의 두께가 변화하면서 금속 선로의 저항이 변경되고, 이로 인해 신호 전달 속도가 늦어질 수 있고,
심한 경우 아래와 같이 아예 금속 선로가 끊기거나 인접한 금속 선로와 붙어버리는 경우도 존재한다.
또한, 단순히 신호를 전달하는 선로가 얇아져서 속도가 느려지는거나 오픈/쇼트가 발생해 오동작하는 것만 문제가 아니다.
반도체 회로를 구성할 때 중요한 것 중 하나가 트랜지스터에 어떻게 전원을 잘 공급하느냐인데, EM은 이에도 영향을 끼친다.
금속 선로의 저항이 변화하면 같은 전압을 바깥에서 공급하더라도, 금속 선로를 지나가며 전압이 떨어져서 트랜지스터에 공급되는 전압이 감소하여 트랜지스터 자체의 속도까지 느려질 수 있고,
최악의 경우 신호 선로와 마찬가지로 전원 선로가 저들끼리 붙거나 끊어지면서 트랜지스터에 전압이 비정상적으로 공급되는 경우도 발생할 수 있다.
(이러한 전원 공급을 위한 금속 선로의 구성을 power grid, power mesh 등으로 부르는데, 이 power grid/mesh의 저항으로 인해 손실되는 전압을 IR Drop이라고 하며 반도체 설계 시 신경 쓰는 부분 중 하나이다)
여담으로 이런 신뢰성에 관한 내용을 설계 시 시뮬레이션 등을 통해 검증하게 되는데, 이 때 칩의 동작 환경에 따라 검증 조건이 달라진다.
예를 들자면, 비교적 교체 주기가 짧고 계속 동작하지만 동작 온도가 그리 크지 않은 모바일 칩셋의 경우 5년에 85도 정도 조건으로 장기간 동작하는 걸 기준으로 보고,
교체 주기가 길지만 가동 시간이 짧고 온도가 높은 차량은 3년에 125도 조건으로 보는 등 차등을 둔다.
(실제로는 파운드리 업체마다 다른 것으로 알고 있음)
물론 실제 설계 시에 이러한 사항을 감안하고 충분한 마진을 두고 설계하고,
기준이 일반적인 사용 조건보다 좀 더 가혹한 조건이기 때문에 하드코어하게 갈구지 않는 이상 일반 사용자가 체감할 일은 별로 없다고 보면 된다
1. 반도체도 수명있음 2. 반도체만드는 회사마다 수명 조금씩 다름 3. 근데 일반인은 신경 안써도 됨
한번쯤 들어본= 네? 처음인데요
그걸 죙일 365일 돌리는 조건 정도에 가까움
금속도 나노미터 단위로 붙일 수가 있구나.. ㄷㄷ
수명이 다르다기보단 검증 조건이 다른거 근데 그 차량용 반도체 쪽은 아예 스탠다드가 있는 걸로 알고 있음
그래서 그릉가 EM 방지하려고 Cu 라인을 점점 두껍게 까는건가
시뮬레이션 툴이 EM을 누적데미지 비스무리하게 계산하는지라 신호가 바뀌는 횟수가 낮거나 신호가 바뀔 때 흐르는 전류가 작다면 문제 없음(전류가 짧고 & 적게 흐른다 => 선로를 지나가는 총 전자 수가 적다) 근데 신호가 자주 바뀌거나 흐르는 전류가 많은 (선로를 지나가는 총 전자 수가 많은 경우) 경우가 취약함 보통 이런 애들은 신호 쪽에선 클럭 트리, 전력 공급 쪽에선 전력 많이 처먹는 곳 그래서 그 클럭은 보통 두껍게 깔고 전력 공급 많을수록 PDN을 촘촘히 깔아서 병렬 저항 구조를 만들어 저항을 줄임
금속도 나노미터 단위로 붙일 수가 있구나.. ㄷㄷ
좋은글이군..
생각해보니 이런 냐용도 수업때 업근해줬으면 좋겠는데 강의평가때 얹어봐야겠다
하드코어하게 갈구는 기준이 일반 사용자가 게임 최고사양으로 돌리는 정도는 아닌거죠?
그걸 죙일 365일 돌리는 조건 정도에 가까움
아 하드코어의 기준이 차량 반도체구나...
딥러닝 학습 1년 내내 돌리는 거랑 비슷하군요
채굴이라거나 딥러닝이라거나?
예쓰 그래서 검증 항목에 따라 다른데 장기간 돌리는 HPC/네트워크/서버 향 검증 조건이 고온 조건인 오토모티브보다 더 빡센 경우도 있슴
아~ 완벽히 이해했어
음 근데 엔트로피는 어차피 무한증가하니 무생물의 수명이 닳아없어지는건 당연한거 아냐?
1. 반도체도 수명있음 2. 반도체만드는 회사마다 수명 조금씩 다름 3. 근데 일반인은 신경 안써도 됨
수명이 다르다기보단 검증 조건이 다른거 근데 그 차량용 반도체 쪽은 아예 스탠다드가 있는 걸로 알고 있음
"우선 알아둬야할 것은"
모임 모임 모임!?
한번쯤 들어본= 네? 처음인데요
중, 고등학생 때 실험한..?
'배운' 임마 '배운'!
배운...? 저 처음 들어요!
고등학교 물리2에서 배우네 이러니 문과인 나는 모르지!
어 중딩인가 고딩 기본 과학때 원자 구조 설명하면서 그 원자핵 치고 가는 실험 설명 있었던거 같은데 착각했나
그런 듯..? 내가 공부를 잘 한 건 아니지만 ㄹㅇ 처음 보는 것 같으니..
어쨋든 사용하면 기계가 때끼고 마모가 일어나는거같은 현상은 있다는거군 그럼 사용을 안한 반도체의경우는 물리적인 수명에 따르나?
사실 저건 반도체 칩 레벨만 본거고 전체 시스템 구성으로 보면 냉납을 비롯한 또 다른 것들이 있을거임 근데 이론상 뭐 녹슬거나 그러지만 않았으면 괜찮지 않을까 싶긴 함
전자가 금속 전자를 치고 지나가서 전선이 물리적으로 끊어질 수 있다니 개신박하네 ㄷㄷ 극미세 영역이라 가능한건가
뭐... 수명이 있겠죠 전기선도 수명이 무한이 아닌데
일반 사용자가 체감할 일 = 인텔 14세대?
선단노드 개발하면서도 잘 몰랐던 내용인데 정리해주셔서 많이 배워가네요~
이 세상의 모든 물건은 소모품이다 체감할 수 있냐 없냐의 차이일 뿐이지.
24시간 돌리는게 문제라면 걍 옛날 컴퓨터 칩은 내구성이 더 좋고나 그런 건 아닌가보네
그땐 저정도로 금속 선로가 저정도로 얇진 않았어서 지금보단 낫지 않을까 싶긴 함
보통 과거 설계가 안전마진을 넉넉하게 잡지
오가노이드 컴퓨터 나오면 남으러나
극단적인 상황 아니면 인류가 체감할 정도로 한 방에 고장나는 일은 없다고 하던가. ㅋ 미국산 로봇, 일본산 로봇도 5분 만에 타버리는 방사능이지만. 쏘련의 고성능 바이오 로봇은 무려 2시간 버틴다고 안정성에 감탄했다는 자조적 농담. ㅋㅋㅋㅋㅋ
에? 전원들어가있고 동작하면 뒤지기전까지 수명인겁니다
교수님은 여러분의 지식수준에 실망했다
엔트로피 특성 상 모든 물질은 열화하므로 O라 생각하고 들어옴
음 이글을 완전히 이해하려면 사전지식이 조금 필요할수도 우리가 흔히 디지털은 무조건 0, 1이라고 생각하고 수많은 트랜지스터들이 전기가 흐르고 안흐르고 상태로 0,1을 구분한다는 다들 알고 있을거임 근데 실제는 전기가 안 흐른다! 딱 전압이 완전히 0V니까 이진법으로 0, 전기가 흐른다! 최대 1v인 회로라 치고 1v! 이럴게 깔끔히 떨어지는것이 아니라, 0.2 0.1 0.15 0.9 0.85 이렇게 전압이 나온다면 0.3 이하는 0으로 처리, 0.8 이샹은 1로 처리.이런식으로 경계값(쓰레드홀드)로 구분이 됨 그래서 위에 글에서 설명한대로 노후화가 되서 기존에는 0.3 이하는 0으로 처리했는데 애매하게 0.25v 이런놈들이 노후화로 0.31이 된다? 반대로 0.85v나오던게 떨어져서 0.79가 됐다? 아까 그 쓰레드홀드를 넘어가면서 오류가 발생함
여기에 보충해서 설명하자면 보다 정확하겐 문턱 전압이 변하며 이걸 판단하고 트랜지스터의 출력이 바뀌는 시간이 느려짐 (입력 신호가 바뀌는 시간이 동일하다고 가정할 때) 근데 현 시점의 디지털 시스템은 클럭이라고 하는 주기적으로 바뀌는 동기화 신호를 기반으로 동작하는데, 그 동기화 시점 전에 출력이 변해서 내가 원하는 지점에 도착해야하는데 그게 안됨 그럼 어케되나요? 셋업 발생해서 동작이 꼬입니다
그러고보니 인텔이 예전에 실버몬트 계열 아톰 칩셋 만들 때 LPC 클럭 열화되는 사고 쳤었지...
불특정 다수에게 설명하는 글을 쓰려면 좀 더 간결해야한다고 생각해요...
글 내용 길어서 제목이랑 첫줄만 봤는데 원리는 기억 아리까리한데 요즘것들은 하도 가늘어져서 대충 5년정도 잡고 극한환경이면 3년정도 잡으면 얼추 맞을거임