Doação Ao BLOG

https://www.paypal.com/cgi-bin/webscr" method="post" target="_top">pl.pires@bol.com.br">https://www.paypalobjects.com/pt_BR/BR/i/btn/btn_donateCC_LG.gif" border="0" name="submit" alt="PayPal - A maneira fácil e segura de enviar pagamentos online!">

quarta-feira, 2 de outubro de 2013

Estrutura eletrônica

http://iopscience.iop.org/chapter/978-0-750-31044-4/bk978-0-750-31044-4ch2




Estrutura eletrônica

Autores: 
DK Ferry 2013 Semiconductors capítulo 2 doi:. 10.1088/978-0-750-31044-4ch2
Publicado em 
Copyright © IOP Publishing Ltd 2013.
Páginas 2-1 a 2-53

Abstrato

É razoavelmente óbvio para qualquer pessoa que se deslocam através de um electrão de um cristal em que há um grande número de potenciais atómicas vai experimentar um comportamento de transporte significativamente diferente de um electrão no espaço livre. De fato, no cristal do elétron está sujeito a um grande número de forças da mecânica quântica e potencialidades. O ponto de desenvolver um entendimento da estrutura electrónica é tentar simplificar a multiplicidade de forças e potenciais para uma forma mais condensada, no qual o electrão é substituído por um quase-partícula com muitas das propriedades do electrão, mas com diferenças importantes nestas propriedades. Significativo entre estes é a introdução de umeficaz de massa, que é representativa da totalidade das forças quântico. Para entender como essa transição é feita, precisamos primeiro entender a estrutura eletrônica dos semicondutores, e essa é a tarefa deste capítulo.
É razoavelmente óbvio para qualquer pessoa que se deslocam através de um electrão de um cristal em que há um grande número de potenciais atómicas vai experimentar um comportamento de transporte significativamente diferente de um electrão no espaço livre. De fato, no cristal do elétron está sujeito a um grande número de forças da mecânica quântica e potencialidades. O ponto de desenvolver um entendimento da estrutura electrónica é tentar simplificar a multiplicidade de forças e potenciais para uma forma mais condensada, no qual o electrão é substituído por um quasi-partícula com muitas das propriedades do electrão, mas com significativa diferenças nestas propriedades. Significativo entre estes é a introdução de uma massa efectiva, a qual é representativa da totalidade das forças quântico. Para entender como essa transição é feita, precisamos primeiro entender a estrutura eletrônica dos semicondutores, e essa é a tarefa deste capítulo.
Primeiro, no entanto, é preciso discutir a forma como a presença da rede atómica e sua periodicidade afectar a natureza da estrutura electrónica. Depois, discutimos o modo pelo qual as funções de Bloch para o cristal surge a partir das funções atómicas ea ligação no cristal. Isso nos leva a discutir como os estados híbridos direcionais são formados e estes, então, levar para as bandas, quando a periodicidade for chamado. Depois disso, vamos discutir uma variedade de situações de espaço real e dinâmica espaço-que ilustram os vários métodos para calcular as bandas de energia reais do semicondutor. Nós, então, voltar-se para a interação spin-órbita perturbative para ver como rotação afeta as bandas, e, em seguida, discutir a aproximação da massa efetiva. Nós terminamos o capítulo com uma discussão de ligas entre diferentes semicondutores.

2.1. Potenciais periódicos

Na maioria dos cristais, a interação com os núcleos, ou átomos da estrutura, não é desprezível. No entanto, a rede tem certas simetrias que a estrutura de energia também deve possuir. O mais importante é a periodicidade, que é representado no potencial que irá ser visto por um electrão quase livre. Suponha-se que considerar um cristal unidimensional, que será suficiente para ilustrar o ponto, então, para qualquer vector L, que é um vector na estrutura, teremos
A Equação (2.1)
Quando dizemos que L é um vector na estrutura, isto significa que ela pode ser escrita como L = nd, onde n é um inteiro, e a é o espaçamento dos átomos na estrutura. Assim, L pode levar apenas alguns valores e não é uma variável contínua. G representa então a periodicidade da grade. O ponto importante é que esta periodicidade devem ser impostas as funções de onda resultantes da equação Schrödin
A Equação (2.2)
Aqui, e por toda parte, tomamos m 0 como a massa do elétron livre. Se o potencial é fraco, as soluções serão próximos aos dos elétrons livres, que iremos abordar em breve. O ponto importante aqui é que, se o potencial não tem a periodicidade de ( 2.1 ), as soluções para as funções de onda ψ (x), deve apresentar um comportamento que é consistente com esta periodicidade. A função de onda em si é complexa, mas a probabilidade de que surge a partir desta função de onda deve ter a periodicidade. Isto é, não podemos identificar um átomo de todos os outros, de modo a probabilidade relativa à presença do electrão deve ser o mesmo em cada átomo. Isto significa que
A Equação (2.3)
e este deve manter, para cada valor de L. Isso também deve manter por dois átomos adjacentes, de modo que podemos dizer que a função de onda em si pode variar, no máximo, um fator de fase, ou
A Equação (2.4)
Geralmente, neste ponto se percebe que a linha de átomos não é infinita, mas tem um comprimento finito. A fim de assegurar que os resultados não são dependentes das extremidades desta cadeia de átomos, que invocam condições periódicas. Se há Nátomos na cadeia, em seguida,
A Equação (2.5)
onde n é um número inteiro de novo. Notamos que o menor valor de pHIV (Diferente de 0) é  , Ao passo que o maior valor é  . A invocação de periodicidade significa que o átomo de N ª é verdade também no átomo de 0.

2.1.1. Funções de Bloch

O valor de π 2 / a tem uma conotação importante, como reconhecê-lo como uma parte fundamental da zona de Brillouin. Para ver isso, vamos escrever a função de onda em termos de sua transformada de Fourier, através da definição
A Equação (2.6)
Ao mesmo tempo, vamos apresentar a transformada de Fourier do potencial em termos da estrutura de base constante ao longo do qual ele é periódica, conforme
A Equação (2.7)
onde n é um número inteiro arbitrário. Assim, vemos que G são harmônicos da freqüência espacial básica do potencial. Se colocarmos esses dois Fourier transforma a equação de Schrödinger ( 2.2 ), obtemos
A Equação (2.8)
No espaço de transformada de Fourier, a analogia com ( 2.4 ), é que existe um operador deslocamento no espaço impulso pelo qual
A Equação (2.9)
de modo que reconhecemos a mudança inerente ao segundo mandato dos colchetes. É importante reconhecer, aqui e mais à frente neste capítulo, que o termo exponencial é ( 2,9 ) é um operador, em que x é um operador diferencial no espaço de momentum [ 1 , 2 ]. O papel deste operador deslocamento é especificamente para deslocar a posição (no espaço de movimento) da função de onda semelhante quantidade C (k). Uma condição suficiente para ( 2,8 ), a ser satisfeita é que a quantidade no colchetes desaparece e, com o deslocamento indicado acima, isto conduz a
A Equação (2.10)
Este resultado representa um conjunto inteiro de equações, uma para cada valor de k, que devem ser resolvidos para encontrar coeficientes de Fourier C (k). O segundo termo representa uma soma de convolução destas coeficientes com os coeficientes do potencial de Fourier. Ao longo deste capítulo, veremos continuamente esta equação em uma variedade de formas ligeiramente diferentes, mas é a base para a determinação da estrutura de banda.
De ( 2.10 ), é evidente que um espectro contínuo de coeficientes de Fourier não está presente. De facto, apenas um número discreto de valores do vector de k são permitidas pela discretização introduzida pelas condições periódicas. Este número é N, o qual é o número de células unitárias de comprimento (cada um) no cristal. Este é frequentemente considerada como sendo o número de átomos, mas isso só é verdade para sistemas com um único átomo por célula unitária. Fazemos notar que os valores de K são seleccionados pelos valores de G. Estes últimos valores formam a rede recíproca no espaço impulso, e o conjunto de valores de k, formada através de ( 2.5 ), uma extensão da célula unitária desta rede recíproca. Esta célula é chamado a zona de Brillouin da rede recíproca (primeiro). (Como uma nota lateral, que normalmente empregam um valor de k que atravessa  para fornecer uma célula centrada.) Agora, vamos voltar para ( 2,6 ) e escrevê-lo em termos do vetor mudou no segundo termo de ( 2.10 ) como
A Equação (2.11)
O termo na colchetes é uma função que é periódica na rede, e na estrutura de reciprocidade. Normalmente, podemos escrever (2,11 ), como a função de Bloch
A Equação (2.12)
O termo entre colchetes de ( 2.11 ) é apenas a representação de Fourier da célula periódica expressão k (x). Assim, é claro que as soluções da equação geral de um potencial Schrödin periódica são as funções de Bloch ( 2,12 ). Estas funções são propriedades gerais de uma onda em uma estrutura periódica e não são exclusivos para a mecânica quântica.

2.1.2. Periodicidade e lacunas na energia

Chegamos a um ponto interessante. As funções de onda para o nosso cristal são agora funções de Bloch, que representam a presença do potencial periódico, e isso muda a natureza das ondas de propagação característica dos elétrons de forma dramática. Se desligar o potencial de cristal, mantendo a periodicidade desse potencial (essencialmente apenas deixando a amplitude tornar-se extremamente pequeno), então ( 2.10 ) reduz-se a energia da partícula livre
A Equação (2.13)
A função de onda Bloch, no entanto, não é único, uma vez que tem sido suficiente para definir k só na primeira zona de Brillouin.Quando usamos um valor de k que atravessa  para proporcionar esta primeira zona de Brillouin, estamos a utilizar o que é chamado de uma célula de Wigner-Seitz, esses valores de k mais perto do ponto Γ (k = 0) do que para qualquer ponto deslocado a partir deste por um vector de rede recíproca  , Onde n é um número inteiro qualquer. Isto significa que o ritmo vector k é definido apenas até uma rede recíproca vector L, de modo que ( 2,13 ) também deve ser satisfeita para qualquer valor do vector de impulso deslocado, conforme
A Equação (2.14)
Mostramos isso na figura 2.1 para três dessas parábolas. A curva representa vermelho ( 2,13 ), enquanto que as curvas azul e verde representam ( 2,14 ) para  e  , Respectivamente. A energia é degenerado em ± 1, bem como a 0 nesta parcela limitada. Deve notar-se que surgem a partir de parábolas todos os valores de L, e não apenas daqueles mostrados.
Figura 2.1. A periodicidade da energia livre exige que várias parábolas se sobrepõem.
Se apenas os valores de k que se encontram na primeira zona de Brillouin (a célula de Wigner-Seitz) são tomadas, a energia é uma função de vários valores de k, e diferentes ramos são caracterizadas por diferentes partes de treliça periódicas da função de Bloch. Cada ramo, na verdade cada valor energético, nesta primeira zona de Brillouin está agora marcado com ambos um impulso índice k e um índice de banda n. Como mencionado, as bandas são degeneradas em alguns pontos especiais, que são limitados nesta discussão unidimensional (que será mais complicado e numerosos em múltiplas dimensões). É nessas degenerescências que o potencial de cristal deverá modificar a imagem quase-free-elétron básica, abrindo brechas nos pontos de cruzamento. Essas lacunas irá substituir os cruzamentos degenerados. Passemos, o impulso de k em ( 2.10 ) uma quantidade G ', de modo que se torna
A Equação (2.15)
Tal como no caso de ( 2.10 ), esta equação é verdade para toda a família de vectores de rede recíproca. No entanto, vamos nos concentrar nas duas parábolas que cruzam a  . Neste ponto, temos
A Equação (2.16)
ou  . Assim, podemos selecionar apenas esses dois termos de ( 2.10 ) e ( 2.15 ), como [ 3 ]
A Equação (2.17)
Obviamente, o determinante da matriz do coeficiente deve desaparecer se as soluções podem ser encontrados, e isto leva a
A Equação (2.18)
onde a última forma é que, dada precisamente no ponto de passagem. Assim, a abertura que se abre é de 2 L e L é exactamente proporcional ao potencial interacção entre estas duas bandas. O estado de energia mais baixa é uma interacção cooperativa (diminuindo assim a energia), denominado a banda de ligação, enquanto que o estado superior surge a partir da competição entre as duas parábolas (aumentando assim a energia) e é denominado a banda anti-colagem. Mais tarde, vamos chamar essas bandas de valência e de condução.
O argumento pode ser levada mais longe, no entanto. Suponha que nós consideramos um pequeno desvio a partir da borda da zona ponto de passagem, e perguntar o que as bandas parecem nesta região. Para ver isso, tomamos  . Em seguida, cada uma das energias pode ser expandido tão
A Equação (2.19)
Usando estes valores de energia na primeira linha ( 2,18 ) dá-nos as duas energias
A Equação (2.20)
Aqui,  é a energia quase livre de electrões na zona de borda e é a energia no centro da abertura. Podemos escrever  e  , E a variação das bandas torna
A Equação (2.21)
para valores pequenos de δ. O potencial de cristal produziu uma lacuna no espectro de energia e a curva resultante bandas muito mais do que as bandas parabólicos normais, como mostrado na figura 2.2 . A equação ( 2.21 ) também serve para introduzir uma massa efetiva, no espírito que a variação banda longe do mínimo deveria ser de quase parabólica, semelhante às parábolas de elétrons livres normais. Assim, para pequenos δ, as massas de colagem e eficazes de anti-colagem estão definidos a partir de ( 2.21 ) na forma
A Equação (2.22)
Pode-se observar que, uma vez que o segundo termo entre parênteses é grande, a massa de ligação é negativa como a energia diminui à medida que nos afastamos da zona de borda. Ao utilizar essas massas eficazes Estamos introduzindo a nossa quase-partículas, ou quase-elétrons, que têm uma massa característica diferente de elétrons livres. No caso de ligação, o quase-partícula é um buraco, ou estado vazio, e essa mudança de sinal da carga compensa o valor negativo da massa, daí que normalmente falam sobre os buracos com massa positiva. Também pode ser notado que as duas bandas não são imagens de espelho muito uma da outra como as massas são ligeiramente diferentes em termos de valor devido à mudança de sinal entre os dois termos de ( 2,22 ). Isso também faz com que a massa de anti-colagem ligeiramente o menor dos dois em magnitude.
Figura 2.2. O potencial de cristal abre uma abertura na borda da zona, a qual é ilustrada aqui. As linhas tracejadas seria o comportamento normal, sem a abertura.
Para maiores valores de δ (o quão grande não pode ser especificado neste ponto), não é justo para expandir as raízes quadradas que estão na primeira linha de ( 2.20 ). O processo mais geral é dado pela
A Equação (2.23)
Nesta forma, temos ignorado o termo de electrões livres (o segundo em ( 2.20 )), como é insignificante para as pequenas massas eficazes. Temos também introduziu a lacuna  aparente na última linha ( 2,18 ). É claro que as bandas se tornam muito nonparabolic medida que nos afastamos da margem da zona e isso também vai provocar uma massa eficaz dependente impulso, um ponto de voltar para mais adiante no capítulo.
A forma da banda de energia encontrada em ( 2.23 ) será visto novamente em uma seção mais tarde, quando incorporar a interação spin-órbita através perturbação teoria em geral, sempre que houver uma interação entre as funções de onda da ligação (valência) eo anti-bonding (condução) banda. Em muitos casos, especialmente em três dimensões, a presença da interacção spin-órbita complica muito as soluções, de modo que é normalmente considerado como uma perturbação. No entanto, vamos ver nas soluções de espaço impulso que pode ser incorporada muito facilmente, sem demasiada aumento da complexidade do sistema (a matriz de Hamilton já é bastante grande, e não é aumentada pelos termos adicionais na energia).

2.2. Potenciais e pseudopotenciais

No desenvolvimento do último capítulo, as somas dentro da Hamiltoniano foram realizadas sobre todos os electrões. Nos semicondutores tetrahedrally coordenados, os títulos são na verdade apenas formado pelos elétrons outershell. Em geral, os electrões do núcleo interno não desempenham nenhum papel no processo de ligação, o qual determina a estrutura do cristal.Por exemplo, as ligações Si são compostas por 3 s e 3 níveis de fósforo, enquanto o GaAs e Ge têm ligações compostas de 4 s e 4 p electrões. Isto não é rigorosamente verdade, como os níveis d internos ocupados (caso existam), muitas vezes se encontram muito próximos a estes ligação s e p orbitais. Isto pode conduzir a uma ligeira modificação das energias de ligação nos referidos materiais encontram-se compostos de átomos inferior na tabela periódica. Embora esta correcção é geralmente pequena, pode ser importante, em alguns casos, e será referido por vezes neste contexto. Normalmente, no entanto, nós tratamos apenas os quatro elétrons das camadas externas (ou oito dos dois átomos nas zinco blende e diamante estruturas por célula unitária).
As equações que demos no capítulo 1 pode ser simplificada quando estamos apenas tratando os elétrons da camada externa de ligação. Podemos reescrever (1.2) e (1.5) como
A Equação (2.24)
onde o último termo representa o deslocamento de energia, devido às energias cinéticas e de interação dos elétrons do núcleo.Esta mudança é importante para muitas aplicações, tais como fotoemissão, mas não é particularmente importante na nossa discussão da estrutura electrónica, uma vez que normalmente irá fazer referência as energias quer à parte inferior da condução ou a parte superior da banda de valência. A segunda soma entre colchetes pode ser reduzido ainda mais em termos para os quais o índice j se encontra no núcleo, ou os elétrons de ligação. No primeiro caso, as contribuições a partir dos electrões do núcleo produzir um potencial que modifica o potencial de cristal real representado no primeiro termo nos colchetes. É este potencial modificado que é denominado um pseudopotential. Isto pode ser escrito como
A Equação (2.25)
Agora, o problema é encontrar esses pseudopotenciais. Nestes problemas a abordagem de primeira princípios é resolver para os pseudopotenciais e as funções de onda de colagem em uma abordagem de auto-consistente [ 4 ]. O efeito da inclusão das contribuições do núcleo de electrões em que o potencial é para remover o núcleo profundo Coulombic do potencial atómica e dar uma mais suave potencial interacção global.
Ainda assim, é preciso abordar a interação entre os elétrons restantes de ligação como isso leva a um comportamento não-linear da equação de Schrödinger. Várias aproximações para este termo tem sido perseguido através dos anos. O mais simples é simplesmente assumir que os electrões de ligação levar a um potencial em geral lisa, e esta interacção resulta do papel potencial desta impõe ao indivíduo de electrões. Esta abordagem de electrões quase único é conhecida como a aproximação de Hartree e dá a contribuição electrónico normal a função dielétrica. A próxima aproximação é incluir explicitamente as taxas de termos-a correção da energia que surge a partir de intercâmbio quaisquer dois elétrons (em média), o que leva à aproximação Hartree-Fock. A abordagem mais geral, a qual é amplamente seguida, é a adopção de um termo funcional de energia, em que a correcção de energia é uma função da densidade local. Este funcional energia é então incluído na solução auto-consistente para as funções de onda e as energias. Esta última abordagem é conhecida como a aproximação locais densidade (LDA) dentro da teoria do funcional da densidade (DFT). Apesar desta variedade de aproximações, os cálculos de primeiros princípios têm dificuldade em determinar a banda lacunas correctamente nos semicondutores. Geralmente, eles encontram os valores para os intervalos de energia que são mais ou menos até uma ordem de grandeza muito pequeno. Embora um certo número de correcções têm sido sugeridos para LDA, nenhum destes tem resolvido o problema da lacuna da banda [ 5 ]. Apenas duas abordagens têm chegado perto, e estas são a aproximação GW [ 6 ] e troca exata [ 7 ]. Na primeira abordagem, um calcula a auto-energia total dos elétrons de ligação e usa a função de Green de partícula única para dar uma nova auto-energia que diminui as energias da banda de valência e corrige a lacuna dessa forma. Neste último caso, utiliza-se um potencial eficaz baseada Kohn-Sham estados de partícula única e um cálculo da energia de interacção com o que é chamado um potencial eficaz. Nenhuma delas será discutida aqui, pois eles vão além do nível de nossa discussão, e um tratamento melhor pode ser encontrada em outros lugares [ 4 , 5 ]. Alguém poderia pensar que as funções de onda e pseudopotenciais para, por exemplo, os átomos de Ga seria o mesmo em GaAs como na abertura, mas isto não tem sido geralmente o caso. No entanto, tem havido um esforço significativo para encontrar essas chamadas funções de onda mobiliários e potencialidades. Isto é verdade independentemente da abordagem e aproximações utilizadas. Tem havido um progresso significativo nesta frente, e vários conjuntos de funções de onda e pseudopotenciais podem ser encontrados na literatura e na internet que se diz ser transferível entre diferentes compostos.
A discussão acima focada sobre os primeiros princípios auto-consistentes abordagens para a estrutura eletrônica. Há uma outra abordagem, que é denominado empírica. Em particular, devido ao problema da lacuna da banda, encontra-se frequentemente que em vez de executar o cálculo auto-consistente completa, pode-se substituir a sobrepor integrais envolvendo diferentes funções de onda e a pseudopotencial com um conjunto de constantes, um para cada integrante diferente, e em seguida, ajustar as constantes para um melhor ajuste aos dados experimentais medidos para a estrutura de banda. As posições de muitos dos pontos críticos na estrutura de banda são conhecidos a partir de uma variedade de experiências, e que são suficientemente conhecidos para utilizar em tal processo. Para ter certeza, nos primeiros princípios de uma abordagem não tentar obter um acordo com alguns dados experimentais. Na abordagem empírica, no entanto, uma lança a necessidade de auto-consistência adotando os resultados experimentais como a resposta "certa" e simplesmente ajusta as constantes para atender esses dados.O argumento é que um tal ajuste já é responsável por todas as informações sobre as interacções inter-electrões, pois eles são incluídos exactamente em qualquer material que é medido experimentalmente. A atracção para uma tal abordagem é que a estrutura electrónica é obtido rapidamente, mas a desvantagem é que o conjunto de constantes assim obtidos não é assegurada de ser transferidas entre os materiais.

2.3. Métodos Real-espaciais

Nos métodos de espaço real, nós calcular a estrutura eletrônica utilizando o Hamiltoniano e as funções de onda escritas em espaço real, tal como o nome indica. O complemento desta, abordagens impulso de espaço, será discutido na próxima seção.Aqui, pretende resolver o pseudopotential versão da equação Schrödin, o qual pode ser escrito como
A Equação (2.26)
onde H 0 inclui a energia cinética do electrão, a função do pseudopotential no local particular, e quaisquer efeitos multi-electrões, embora irão ignorar o último termo aqui. O pseudopotential é apenas ( 2,25 ). Para continuar, precisamos especificar uma rede, eo conjunto de base da função de onda. Claro, desde que estamos interessados ​​em uma abordagem de espaço real, o conjunto de base será um orbital (ou mais de um) localizada em um local de rede particular, ea base é assumida para satisfazer orthonormality imposta em diferentes sites de treliça. Vamos ilustrar isso ainda mais no tratamento a seguir. Nós vamos passar por isso pela primeira vez em uma dimensão espacial, e para tanto um e dois átomos por célula unitária da estrutura. Em seguida, vamos tratar grafeno como um exemplo específico de uma rede bidimensional que, na verdade, ocorre na natureza.Finalmente, vamos passar para o cristal tridimensional com quatro orbitais por átomo, a base sp 3 definir comum aos semicondutores tetraédricas. Um ponto muito importante é que, ao longo desta discussão, vamos considerar apenas as integrais de dois pontos e interações. Ou seja, vamos ignorar integrais em que as funções de onda estão em átomos 1 e 2, enquanto que o potencial pode ser proveniente de átomo 3. Embora estes possam ser importante, em alguns casos de cálculos de primeiros princípios, elas não são necessárias para as abordagens empíricos.

2.3.1. Bandas em uma dimensão

Tal como mostrado na figura 2.3 , assumimos uma cadeia linear de átomos espaçados uniformemente pela constantes de redea. Como anteriormente, usaremos as condições de contorno periódicas, embora eles não aparecem especificamente, exceto no uso da zona de Brillouin e suas propriedades. Com as condições de contorno periódicas, um átomo de N na figura se dobra para trás sobre a átomo de 0, de modo que estes estão ao mesmo átomo. Adotamos um índice j, que designa que átomo na cadeia, estamos lidando. Como discutido acima, o conjunto de base para a expansão é uma função, em que cada onda é localizada em cima de um único átomo de modo que aparece como orthonormality
A Equação (2.27)
em que nós utilizamos a notação de Dirac para o nosso conjunto de base. Geralmente, o uso de Dirac notação simplifica as equações, e reduz a confusão e desordem, e vamos seguir aqui, tanto quanto possível. Assumimos ainda que existem funções próprias de energia, e que as energias diagonais são a mesma em cada átomo, já que não pode distinguir um átomo do outro, de modo que
A Equação (2.28)
Figura 2.3. Uma cadeia unidimensional de átomos, uniformemente espaçados pela constante de rede.
A suposição vital que seguimos ao longo desta seção é que a interação do vizinho mais próximo domina a estrutura eletrônica.Por isso, não vai além de interações vizinhos mais próximos do que outros para discutir em pontos críticos, onde pode-se usar as interações de longo alcance para alguma vantagem. Vamos agora aplicar ( 2.26 ) para uma função de onda em algum ponto i,onde 0 ≤ i ≤ N, que é um dos átomos da cadeia da figura 2.3 . No entanto, devemos incluir a interação entre o átomo e seus vizinhos, que surge a partir da pseudopotential entre os átomos. Assim, podemos reescrever ( 2,26 ) como
A Equação (2.29)
Se premultiply esta equação com o complexo conjugado da função de onda neste site, obtemos
A Equação (2.30)
O segundo eo terceiro termos são as conexões que temos de avaliar. Para fazer isso, utilizam as propriedades do operador de deslocamento para definir
A Equação (2.31)
onde a exponencial é exatamente o operador de deslocamento no espaço real na mecânica quântica e muda a função de onda de um local atômica [ 8 ]. Da mesma forma, o terceiro termo produz o complexo conjugado do exponencial. Estamos, então, saiu com a integração do local pseudopotential
A Equação (2.32)
onde A é uma constante. Pode-se, na verdade, utilizar orbitais exacta e as pseudopotencial para avaliar esta integral, em oposição a montagem de dados experimentais. A diferença é que entre os primeiros princípios e métodos empíricos, que discutiremos mais tarde. Aqui, vamos apenas supor que o valor é encontrado por uma técnica ou outra.
Usando as expansões acima e avaliações dos vários sobreposição integrais que aparecem nas equações, podemos escrever o resultado como
A Equação (2.33)
Esta estrutura de energia é representada na figura 2.4 . A banda é de 4 A largura (menor para o maior de energia) e centrado sobre a energia local único E 1, que diz que ele faz por espalhando essa energia único átomo. Ele contém N valores de K, uma vez que existem átomos de N da cadeia, e este é o nível de quantificação da variável dinâmica, como mostrado anteriormente.Isto é, não existe um único valor de k para cada célula unitária do cristal. Se incorporar a variável de rotação, então a banda pode armazenar 2 N elétrons, pois cada estado tem um up-spin e um elétron-spin para baixo. No entanto, nós só temos N elétrons a partir dos sites atômicas N. Por isso, essa banda seria meio cheio, com a energia de Fermi deitado no meio da banda.
Figura 2.4. Bandstructure O resultando de uma cadeia unidimensional com interação vizinho mais próximo.
Suponha que agora adicionar um segundo átomo por célula unitária, de modo que temos uma base diatômico. Isto é ilustrado na figura 2.5 . Aqui, cada célula unitária contém os dois átomos de desiguais (um azul e um verde neste exemplo). A rede pode ser definida quer com o azul ou verde, os átomos, mas cada um contém uma rede local com base em dois átomos. Isso vai mudar significativamente a estrutura eletrônica. Teremos duas funções de onda, um para cada um dos dois átomos na base.
Figura 2.5. Uma rede diatômico. Cada célula unitária contém um azul e um átomo de verde, e isso vai mudar a estrutura eletrônica, mesmo que continua a ser uma estrutura unidimensional.
Isto por sua vez leva a ter de gravar duas equações para contabilizar os dois átomos, e existem duas distâncias envolvidas na interacção átomo B-G. Há uma interacção na qual os dois átomos são separados por b e uma interacção na qual os dois átomos são separados por um b. A constante de rede, no entanto, continua a ser um. Para continuar, precisamos adotar uma notação um pouco mais complicado. Vamos supor que os átomos azuis será indexado pelo site i, quando i é um número par (incluindo o 0). Da mesma forma, vamos supor que os átomos verdes será indexado pelo site i, quando i é um número ímpar.Temos de escrever duas equações, uma para quando o site central é um átomo de azul e uma para quando o site central é um átomo de verde. Realmente não importa qual sites que escolher, mas levamos os locais adjacentes, a fim de que estas equações tornam-se
A Equação (2.34)
Assumimos aqui que é um (atom azul), mesmo número inteiro, a fim de avaliar as integrais. Se, agora, o primeiro premultiply destas equações com o valor complexo do local central i, e o segundo pelo valor complexo do local central i + 1, e integrar, obtemos
A Equação (2.35)
Agora, nós temos quatro integrais para avaliar, e estes tornam-se
A Equação (2.36)
Aqui, temos tido a sobreposição integrais ser diferente para os dois átomos diferentes. A escolha do sinal dos dois termos Aassegura que a diferença vai ocorrer em k = 0. A direcção em que para traduzir as funções de onda é escolhida de modo a assegurar que o de Hamilton é Hermitiana. As duas equações agora dar-nos uma determinante secular que deve ser resolvido como
A Equação (2.37)
É claro que os dois elementos fora da diagonal são complexos conjugados de cada um dos outros, e isto assegura que o de Hamilton é Hermitiana e as soluções de energia são reais. Este requisito básico deve ser satisfeito, não importa quantas dimensões que temos na rede, e é uma propriedade básica da mecânica quântica para ter valores próprios reais e mensuráveis, a Hamiltoniana deve ser Hermitian. Nós descobrimos agora que duas bandas são formados a partir deste diatómico estrutura, e estes são imagens de espelho em torno de um a meio caminho entre a energia mais baixa de energia da banda superior e a mais alta de energia da banda inferior. A energia é dada pela
A Equação (2.38)
As duas bandas são mostradas na figura de 2,6 para os valores de E 1 = 5, A 1 = 2, A = 2 0,5. Eles são espelhados em torno do valor de 5, e cada uma tem uma largura de banda de 1.
Como na rede monatomic, cada banda possui N estados de momentum, uma vez que existem N células unitárias na rede.Como antes, cada banda pode assim realizar 2 N elétrons quando levamos em conta a degenerescência de spin dos estados.Agora, no entanto, os dois átomos por célula unitária fornecer exactamente 2 N electrões, e estes irão preencher a banda inferior da figura 2.6 . Portanto, esta estrutura diatómico representa um semicondutor ou isolante, dependendo de quão grande o gap é.Aqui, é de 3 (presumivelmente eV) de largura, que, normalmente, ser interpretado como uma grande lacuna da banda do semicondutor.
Figura 2.6. As duas bandas que surgem para uma rede diatômica. Os valores dos diferentes parâmetros são mostrados na figura.

2.3.2. Látice bidimensional

Para o caso bidimensional, tomaremos um exemplo de uma verdadeira materiais bidimensionais, e que é grafeno. Grafeno é uma camada única de grafite que foi isolada recentemente, [ 9 ]. Normalmente, as camadas de grafeno são muito fracamente ligados um ao outro, o que é por que a grafite é utilizada para lápis de grafite e é útil como um lubrificante. A camada única de grafeno, por outro lado, é extremamente forte, e tem sido sugerido para um grande número de aplicações. Aqui, queremos discutir a estrutura de energia. Para começar, referem-se a estrutura cristalina e rede recíproca mostrado na figura 2.7 . Grafeno é uma camada única de C átomos, os quais estão dispostos numa rede hexagonal. A célula unitária contém duas C átomos, que são não equivalentes. Assim, a célula é uma unidade básica de diamante que tem uma base de dois átomos. Na figura 2.7 , os vectores de unidade de célula de diamante são designados como um 1 e um 2 , e a célula é fechada por linhas tracejadas vermelhas. Os dois átomos de inequivalent são apresentados como a uma (vermelha) e B (azul átomos). Os três vectores vizinhos mais próximos também são mostradas a partir de um apontador B átomo para as três mais próximas A átomos. A rede recíproca também é um diamante, uma rotação de 90 graus a partir da estrutura que no espaço real, mas o hexágono mostrado é geralmente utilizada. Existem dois pontos inequivalent em dois cantos distintos do hexágono, que são marcados como K e K '.Como veremos, a condução e de valência bandas toque nestes dois pontos, de modo que eles representam dois vales em qualquer banda. Os dois vectores unitários da rede recíproca são 1 e 2 , com 1 normal a uma 2 e 2 normal a um 1 . A distância do vizinho mais próximo é a = 0,142 nm e daí pode-se escrever os vetores de treliça e vetores rede recíproca como
A equação (2.39)
K e K pontos 'estão localizados no
A equação (2.40)
A partir desses parâmetros, podemos construir as bandas de energia com a interação do vizinho mais próximo. Isso foi feito, aparentemente pela primeira vez por Wallace [ 10 ], e nós basicamente seguir a sua abordagem.
Figura 2.7. A estrutura cristalina do grafeno (à esquerda) e sua rede recíproca (direita).
Assim como no nosso diatómico rede unidimensional, vamos assumir que a função de onda tem dois componentes básicos, um para a Um e outro para as B átomos. Assim, podemos escrever a função de onda da seguinte forma:
A equação (2.41)
Aqui, nós escrevemos a posição ea força como vetores bidimensionais. Cada uma das duas funções de onda de componente é uma soma de funções de onda para cada tipo de átomo. Totalmente sem especificar o Hamiltoniano, podemos escrever a equação de Schrödinger como
A equação (2.42)
Neste ponto, premultiply ( 2,42 ), a primeira com o conjugado complexo do primeiro componente da função de onda, integrar e, em seguida, com o conjugado complexo do segundo componente da função de onda. Isso conduz a duas equações, que podem ser escritas como
A equação (2.43)
com
A equação (2.44)
Como mencionado, nós só vamos usar interações vizinhos mais próximos, de modo que os termos diagonais se
A equação (2.45)
No grafeno, as ligações in-plane que mantêm os átomos juntos são sp dois híbridos, enquanto que o transporte é fornecido peloz orbitais normais ao plano. Por isso, o integrante local nos Uma átomos e nas B átomos deve ser exatamente o mesmo, e isso é simbolizado em ( 2.45 ), atribuindo-lhes a mesma energia líquida. Pelo mesmo processo, os termos fora da diagonal tornar
A equação (2.46)
A soma dos três exponenciais mostrados entre parênteses é conhecida como uma soma Bloch . Cada termo é um operador de deslocamento que movimenta a uma função de base para o átomo B átomo onde o integral é realizada. Os três vectores vizinhos mais próximos foram mostradas na figura 2.7 . Nós podemos escrever suas coordenadas, em relação a um B átomo como mostrado na figura, com a
A equação (2.47)
Com um pouco de álgebra, o elemento fora da diagonal agora pode ser escrita como
A equação (2.48)
Agora que os vários elementos da matriz foram avaliadas, a matriz de Hamilton pode ser escrita a partir destes valores. Isto leva ao determinante
A equação (2.49)
Isso nos leva ao resultado
A equação (2.50)
O resultado é apresentado na figura 2.8 . O fato mais óbvio sobre essas bandas é que a condução e de valência bandas toque no seis K e K pontos 'em torno da célula recíproca hexágono da figura 2.7 . Isto significa que não há nenhuma diferença de banda. Na realidade, a expansão do ( 2,49 ) para os valores pequenos de impulso de distância a partir destes seis pontos mostra que as bandas são lineares. Estes têm vindo a ser conhecida como bandas de Dirac sem massa, na medida em que eles dão resultados semelhantes para as soluções da equação de Dirac com uma massa de repouso zero. Se este pequeno impulso é escrito como ξ, então a estrutura de energia tem a forma (com 0 = 0)
A equação (2.51)
Figura 2.8. A condução e bandas de valência do grafeno de acordo com ( 2.50 ). O toque bandas no K e K pontos 'em torno da célula hexagonal.
As experiências mostram que a largura da banda de valência é de cerca de 9 eV, de modo que γ 0 ~ 3 eV. Utilizando este valor, bem como a estrutura de energia ( 2.50 ), chegamos a uma velocidade de Fermi eficaz para estas bandas lineares de cerca de 9,7 × 10 7 cm s -1 . Deve-se ressaltar que, embora a massa de repouso é zero, a massa dinâmica dos elétrons e buracos não é zero, mas aumenta linearmente com ξ. Essa variação também foi visto experimentalmente, usando ressonância ciclotron para medir a massa [ 11 ]. A abordagem acima da estrutura de bandas do grafeno funciona muito bem. Em altas energias, a natureza nominalmente circular de "superfície" a energia perto dos pontos de Dirac torna-se trigonal, e isso pode ter um grande efeito sobre o transporte. Para uma abordagem mais avançada, o que também leva em conta os sp duas faixas decorrentes dos títulos in-plane, é preciso ir aos primeiros princípios abordagens descritas em uma seção posterior [ 12 ].
Como com a rede diatómico, existem N estados em cada banda bidimensional, onde N é o número de células unitárias no cristal. Com a rotação, a banda de valência pode, assim, realizar 2 N elétrons, que é apenas o número disponível dos dois átomos por célula unitária. Assim, a energia de Fermi no grafeno puro reside no ponto zero, onde as bandas se encontram, que é denominado o ponto de Dirac.

2.3.3. Coordenação tridimensionais lattices-tetraédrico

Vamos agora voltar nossa atenção para treliças tridimensionais. Como a maioria dos semicondutores tetraédricas quer ter o zinco-blenda ou estrutura do diamante, vamos nos concentrar sobre estes. Antes, porém, temos de considerar a grande diferença, já que esses átomos têm, em média, quatro elétrons das camadas externas. Estes podem ser caracterizados como um único s estaduais e três p estados. Assim, os quatro orbitais irá hibridizar em quatro ligações direcionais, cada uma das quais aponta para os quatro vizinhos mais próximos. Como estes quatro vizinhos correspondem aos vértices de um tetraedro regular, vemos por estes materiais são referidos como tetraédrico. O grupo de quatro materiais (C, Si, Ge, Sn e cinza), todos têm quatro elétrons das camadas externas. Por outro lado, a III-V e VI-II materiais apenas têm uma média de quatro electrões. Estes últimos materiais têm a estrutura de zinco-blenda, enquanto que as primeiras têm o diamante. Estas duas treliças diferem na composição da base que fica em cada local de rede.
Na figura 2.9 , que ilustram os dois reticulados no painel da esquerda da figura. A célula básica é um cubo de faces centradas (FCC), com átomos nos oito cantos e centrado em cada face. Estes átomos estão apresentados como os vários tons de vermelho. Cada local tem uma estrutura base de dois átomos, um vermelho na figura e um azul. A coordenação tetraédrico é indicado pelos laços verdes mostrados para o canto inferior esquerdo azul átomo formam para os vizinhos mais próximos vermelhas. Apenas quatro dos átomos segunda base são mostrados, assim como as outras encontram-se fora desta célula FCC. Esta não é a célula unitária, mas é a forma mais vulgarmente usada para descrever esta estrutura. No diamante (e Si e Ge, bem), os dois átomos de base são os mesmos, tanto C. Nos materiais compostos, haverá um átomo de cada um dos compostos na base, por exemplo, um Ga e uma Como átomo de GaAs. Veremos a seguir que os quatro vizinhos mais próximos significa que teremos quatro exponenciais nos montantes Bloch.
Figura 2.9. A estrutura blenda de zinco (à esquerda) e sua rede recíproca (direita).
No painel direito da figura 2.9 , a zona de Brillouin para a rede FCC é mostrado. Este é um octaedro truncado. Evidentemente, também pode ser visto como um cubo no qual as oito cantos foram removidos. As importantes direcções cristal têm sido indicados na figura. Os pontos são importantes do ponto de Γ no centro da zona, o X ponto no centro das faces quadradas e o Gponto no centro das faces hexagonais. É importante perceber que estas formas bem empilhar uns sobre os outros por apenas mudando a segunda célula ao longo de qualquer dos outros dois eixos. Portanto, se você passar de Γ ao longo da direção (110), uma vez que você passar o ponto K você vai estar no topo rosto quadrado da próxima zona. Assim, você vai chegar ao X ponto ao longo da direção (001) de que a zona de Brillouin. Isto se tornará importante quando marcamos as bandas de energia mais tarde nesta seção.
A matriz de Hamilton será de 8 × matriz 8, que pode ser decomposto em quatro 4 × 4 blocos. Os dois blocos diagonais são ambos diagonal na natureza, com o atômica s e p energias ao longo dessa diagonal. Os outros dois blocos-o bloco superior direito e inferior esquerdo do bloco são matrizes de posto completo. No entanto, o bloco inferior esquerda é o complexo hermitiano (complexo, transposição) do bloco de canto superior direito, como isto é necessário para o total de Hamilton para ser Hermitiana. Estes dois blocos representam as interações de um orbital no Um átomo com um orbital no B átomo; esses blocos conterá as somas Bloch. As somas Bloch conter os operadores de tradução quatro de um átomo para seus quatro vizinhos. Se tomarmos um um átomo como a origem das coordenadas de referência, então os quatro vizinhos mais próximos são posicionados de acordo com os vectores
A equação (2.52)
O primeiro vector, por exemplo, os pontos a partir do átomo de vermelho inferior esquerdo ao azul mostrado no painel da esquerda da figura 2.9 , juntamente com a ligação correspondente. Agora, o 8 × 8 matriz tem a seguinte forma geral
A equação (2.53)
com o bloco inferior esquerdo sendo preenchida pelo complexo conjugado transposto apropriada do bloco de canto superior direito. Adotamos também uma notação abreviada para x , y , z para x , y , z . Fazemos notar que, se a reverter os dois índices (quando forem diferentes), isto tem o efeito de conjugar a energia complexo resultante. Trocando as A e B átomos inverte o sistema de coordenadas, de modo que essas operações fazem o número de Bloch somas reduzir para apenas quatro diferentes.
Para começar, nós consideramos o prazo para a interação entre o s estados sobre os dois átomos. O s estados são esfericamente simétrica, para que não haja variação angular de importância fora que os argumentos das exponenciais, por isso não precisa se ​​preocupar com os sinais na frente de cada termo da soma Bloch. Assim, este termo torna-se [ 13 ]
A equação (2.54)
Ligamos a matriz elemento ss . Ao expandir cada exponencial em seu termos de seno e co-seno, a soma pode ser reescrita, depois de alguma álgebra, como
A equação (2.55)
Notamos que a soma tem uma simetria entre x , y , e z , que decorre do fato de que os eixos coordenados são facilmente trocados. Em certo sentido, isso decorre da simetria esférica, mas também vamos ver este termo aparece em outro lugar. Por exemplo, vamos considerar o prazo para o equivalente p estados
A equação (2.56)
Aqui, a mesma soma Bloch surgiu porque todos os x orbitais apontam na mesma direção, a parte positiva da função de onda se estende para o positivo x direção. Desde o x eixo não tem qualquer diferença real do y e z eixos, ( 2.55 ) também vale para os dois termos e  .Assim, toda a diagonal do bloco da direita superior tem a mesma soma Bloch. Agora, vamos nos voltar para a situação para a interação do s orbital com um dos p orbitais, que se torna
A equação (2.57)
Agora, notamos que dois sinais mudaram. Isto é porque os dois x orbitais apontar para fora a partir do um átomo, enquanto os outros dois pontos em relação a um átomo. Assim, estes dois pares de operadores de deslocamento têm sinais diferentes.Seguindo a convenção de medida, que irá indicar o elemento de matriz como sx , e a soma torna-se Bloch
A equação (2.58)
Podemos, agora, considerar os outros dois elementos da matriz para as interações entre um s estado e uma p estado. Estes são criados usando a simetria óbvio , o que leva a
A equação (2.59)
e
A equação (2.60)
Estes montantes Bloch também irá realizar para as interações entre duas p orbitais. Por exemplo, se considerarmos x e y , é a z eixo que está ausente, e assim isso conduz a 3 , que tem a única z direcção.
Ao inverter os átomos do tetraedro é invertido e os quatro vectores ( 2,51 ) são invertidos. Na soma Bloch, isto é equivalente a inverter as direcções do movimento, que é através de uma inversão a origem das coordenadas. Isto leva cada B em seu conjugado complexo. Invertendo a ordem das funções de onda do elemento da matriz também introduziria um complexo conjugado com as energias, mas estes foram tomadas como real, para que isso não muda nada. No entanto, temos de manter o controle de qual átomo do s orbital está localizado na para os s-p elementos da matriz, já que esta mistura diferentes orbitais de dois átomos. Podemos agora escrever o bloco o bloco superior direito (off-diagonal 2,53 ), como
A equação (2.61)
Como discutido acima, o resto do 8 × 8 matriz é preenchida para fazer a final matriz Hermitiana, e isto pode ser diagonalizamos para encontrar as bandas de energia como uma função do vector da onda k .
Em alguns pontos, tais como o ponto de Γ e X ponto, a matriz irá simplificar. Por exemplo, no ponto Γ a 8 × 8 pode ser decomposto em quatro 2 × 2 matrizes. Três destes são idênticos, como o são para os três p resultados de simetria, que retêm a sua degeneração. A quarta é a matriz s resultado simetria. Isto é importante, uma vez que significa que, no ponto Γ a única mistura ocorre entre orbitais como em cada um dos dois átomos. Cada uma destas matrizes é facilmente diagonalizamos menores. A mistura dos s orbitais leva a
A equação (2.62)
Quando os A e B são átomos do mesmo, como em Si, o que reduz a 1,2 = s ± 4 ss . Do mesmo modo, o p mistura conduz ao resultado
A equação (2.63)
Novamente, quando os A e B são átomos do mesmo, como em Si, o que reduz a 3,4 = p ± 4 xx . Há um ponto importante aqui, The Atomic s energias deitar abaixo os p energias. No entanto, a parte inferior da banda de condução é geralmente simétrica esférica, ou é semelhante, enquanto que a parte superior da banda de valência é tipicamente triplamente degenerado, o que significa p -like. Assim, a parte inferior das duas bandas (condução e de valência) é s -como, enquanto a parte superior é p-like. A parte superior da banda de valência é a menor das duas p níveis, e por isso provavelmente deriva do anião do composto, de modo que a parte superior da banda de valência é derivado de anião p estados. Por outro lado, a parte inferior da banda de condução é da maior energia s do nível, e por isso é geralmente derivado do catião s unidos.
Ajustando as várias constantes de acoplamento de dados experimentais que veio a ser conhecido como o método tight-binding semi-empírico (SETBM). Na figura 2.10 , podemos traçar a estrutura de banda para GaAs usando apenas os oito orbitais discutidos aqui. O hiato de banda encaixa muito bem, mas as posições de L e X mínimos das bandas de condução não estão correctos. O G mínima deve ser apenas cerca de 0,29 eV acima do fundo da banda de condução, enquanto que o X mentira mínimos de cerca de 0,5 eV acima do fundo da banda de condução. Acontece que os vazios s orbitais do próximo nível reside apenas um pouco acima dos orbitais utilizados aqui. Se os orbitais excitado ( s *) são adicionadas para dar um modelo de dez orbital (Bloch as somas permanecem as mesmas que as es orbitais, mas as energias de engate são diferentes), então um ajuste muito melhor para as bandas experimentais podem ser obtidos [ 14 ]. Isto é mostrado na figura 2.11 . Fazendo referência à figura 2.9 , as bandas em ambas as figuras são marcados ao longo da linha de L para baixo (111) para Γ, em seguida, para fora (100) para o X ponto antes de saltar para a segunda zona X ponto, a partir da qual eles podem voltar ao Γ junto (110), passando por K . Este é um caminho relativamente standard, e que usamos ao longo deste capítulo e livro. Uma alternativa ao uso dos estados excitados é ir para interações segunda-vizinho, que também pode fornecer algumas correções.
Figura 2.10. estrutura de banda de GaAs calculados com apenas sp 3 orbitais pela SETBM.
Figura 2.11. As bandas de energia do GaAs calculados com o sp s * 10 abordagem banda.
Na figura 2.12 , as bandas de energia para Si são plotados usando o sp s abordagem *. Pode ser visto que esta não é uma diferença directa, como o mínimo da banda de condução é ao longo da linha de Γ para X . A posição é de cerca de 85% da forma de X , e esta linha é denotado geralmente Δ . Referindo-se a figura 2.9 , novamente, vemos que há seis tais linhas, de modo que o mínimo indicado na figura é realmente um dos seis tais mínimos, cada um ao longo das seis versões diferentes do (100) linha.
Figura 2.12. As bandas de todo o gap para Si calculado usando o sp s método *.

2.3.4. Primeiros princípios e abordagens empíricas

Como discutido anteriormente, pode-se utilizar as funções de onda reais e as pseudopotenciais para avaliar os vários parâmetros de energia caracterizam aqui. Ou, pode-se usar estes parâmetros de energia para a montagem das bandas com valores determinados experimentalmente. Uma das melhores abordagens para primeiros princípios de ligação estreita foi formulado por Sankey [ 15 ]. Um conjunto de orbitais atômicos localizados, chamado bolas de fogo , foi criado e acoplado a uma troca eficiente e correlação funcional. Esta abordagem foi aumentado para três integrais centro para melhorar o comportamento.Além disso, a dinâmica molecular, permitindo-a rede para relaxar enquanto o cálculo da inter-átomo de forças, também foi usado para obter relaxado, ou otimizado, estruturas. Uma revisão completa apareceu recentemente [ 16 ].
A maioria das pessoas, no entanto, prefere a via mais simples e mais eficiente computacionalmente, da abordagem de semi-empírica [ 13 ], em que os parâmetros são variadas de modo a que as faixas se encaixam de lacunas determinados experimentalmente. Por outro lado, existe sempre um problema de que as experiências deve ser usado para as medições, e cujos resultados devem ser aceites. A estrada geral seguida pelos físicos computacionais é apto para medições ópticas de transições inter-bandas, embora isso se ajusta falhas, em vez de ajustar os pontos reais na banda. A minha preferência, como uma pessoa de transporte, é para se ajustar a vários extremos da banda de condução, bem como a diferença de energia em princípio Γ. Anteriormente, mencionamos as posições dos X e L pontos em relação à parte inferior da banda de condução de Γ.Estes também têm sido determinados experimentalmente, e são mais importantes para os dispositivos semicondutores, como a maioria destes utilizar n um material do tipo em que o transporte é por electrões da banda de condução. Como principais regiões de banda de condução serão amostrados em tais dispositivos, é mais importante que a condução correcta do que é a diferença na óptica L é, (embora esta abertura pode ainda estar apto razoavelmente perto).
Vamos considerar alguns dos problemas que surgem na abordagem empírica. Começamos com Si, onde a parte superior e inferior da banda de valência são tomados como -12,5 0 e, respectivamente, com a primeira por conveniência e o último proveniente de experiências [ 17 ]. O importante é que o estado de simetria deve ser o limite inferior da banda de condução de Γ não é duplamente degenerado estado na figura 2.12 , mas o único estado de cima, que se situa 4,1 eV acima do topo da banda de valência [ 16 ]. Usando ( 2.62 ), esses valores dão ss = 2,08 eV e s = -4,2 eV. A diferença s - p é dado como 7,2 eV por Chadi e Cohen [ 18 ], de modo que p = 3 eV. Agora usamos ( 2.63 ) ao descobrir que xx = 0,75 eV. Neste momento, existem apenas dois parâmetros deixados com a qual se encaixam todos os outros pontos críticos na estrutura de banda. Isto torna-se uma tarefa difícil, e é fácil ver por que estender o conjunto de base para os estados excitados ou incorporar interações segunda-vizinho se torna importante. Estes irão levar a novos parâmetros com os quais se encaixam os outros pontos críticos na zona de Brillouin. Mesmo com os parâmetros adicionais para os semicondutores compostos, era óbvio na figura 2.10 que um bom ajuste não foi obtido. Acrescentando apenas os estados excitados deu novos parâmetros que o bom ajuste da figura bastante 2.11poderiam ser obtidos. Nas tabelas 2.1 e 2.2 são apresentados os parâmetros para alguns semicondutores. Existem vários conjuntos de parâmetros na literatura, e um tal conjunto é de Teng et ai [ 19 ].
Tabela 2.1. parâmetros Tight-vinculativos para selecionar materiais.
ABABssxxxysx ABsx BA
Si-4.2-4.21,721,72-2,080.431.141.431.43
GaAs-2.7-8.33.860.85-1,620.451.261,421.14
InAs-3,53-8,743.930,71-1,510,421.11.731.73
InP-1,52-8,54.280.28-1,350.360.961.331.35
Tabela 2.2. Alguns parâmetros de estado excitado.
s * As * Bs * p ABs * p BA
Si6.26.21.31.3
GaAs6.748.60,751,25

2.4. Métodos espaciais Momentum

Claramente, a maneira mais fácil de definir sobre a abordagem espaço impulso é adotar as funções de onda de elétrons livres, que discutimos na seção 2.1 . Se os potenciais devido aos átomos são ignorados, então esta abordagem onda plana é exata, e recupera uma das bandas de elétrons livres descritos na figura 2.1 . No entanto, é a perturbação destas bandas pelos potenciais atómicas que é importante. O caso mais simples foi descrita na figura 2.2 . Se os potenciais atômicos pode ser feita relativamente suave, então a abordagem onda plana pode ser feita relativamente precisas, embora o uso da palavra "relativa" aqui pode ser abusado. O problema é a forma de lidar com o potencial variando rapidamente em torno dos átomos, e também como incorporar os electrões principais que modificam este potencial, mas não contribuem (muito) para as propriedades de ligação dos semicondutores. Geralmente, o potencial perto dos núcleos varia muito mais rapidamente do que um potencial de Coulomb simples, e isto significa que será necessário um grande número de ondas planas. A presença dos elétrons do núcleo, e este potencial variando rapidamente, pode complicar o cálculo, e fazer uma abordagem composto unicamente por ondas muito difíceis de avião. Um compromisso possível foi proposto por Slater [ 20 ], que sugeriu que as ondas planas ser aumentada por tratamento das funções básicas de onda como as encontradas em resolver o problema átomo isolado em um potencial simetria esférica. Em seguida, o potencial local em torno do átomo é descrito por este mesmo potencial de simetria esférica e até um raio especial, para além do qual o potencial é constante. Assim, este método onda plana aumentada (APW) usa o que é chamado de potencial de muffin-tin (sugerido pela relação com uma verdadeira lata do muffin).
Ainda mais tarde, Herring [ 21 ] sugere que as ondas planas deve ter uma mistura das funções de onda do núcleo, de modo que através da variação da força de cada mistura de núcleo, pode-se fazer a função de líquido de onda ortogonal a todas as funções de onda do núcleo. Ao utilizar estas ondas planas ortogonalizadas (método OPW), o potencial real utilizado no cálculo da estrutura da banda pode ser suavizado (levando à pseudopotential da secção 2.2 ) e um número mais pequeno de ondas planas seria necessária. A abordagem OPW, como o método APW acima, é um de um número de tais abordagens celulares nos quais potenciais reais são utilizados dentro de um certo raio do átomo, e um potencial mais suave (ou não) é utilizado fora desse raio.O princípio é que, fora do raio do núcleo chamado podemos usar uma representação onda plana, mas nós temos que fazer essas ondas plano ortogonal ao núcleo estados. Para começar, com isso, um conjunto de funções de onda centrais
A equação (2.64)
é adotado, onde o índice t significa um núcleo orbital e em particular um representa a posição atômica. Este é, então, transformada de Fourier, como
A equação (2.65)
Agora, uma versão de um OPW, pode ser construído como
A equação (2.66)
As constantes t, um agora estão ajustados para tornar o estado de ondas plano ortogonal a cada uma das funções de onda do núcleo. Ao mesmo tempo, o potencial é suavizada pela função de onda do núcleo e obtém-se o pseudopotential desta maneira.
Se esta abordagem for seguida, a simulação de primeiros princípios auto-consistente depende de gerar o conjunto de funções do OPW e determinar o conjunto apropriado de energias de interacção (Hartree, Hartree-Fock, LDA, e assim por diante), e encontrando a pseudopotential correcta. Esta abordagem foi aparentemente iniciado por Phillips [ 22 ], e agora há muitas abordagens (ver [ 5 ]), mas vamos descrever o método pseudopotential empírica . Nesta abordagem, o que é inteiramente no mesmo espírito que o método tight-binding empírica [ 16 ], um ajusta as pseudopotenciais para caber medidas experimentais de muitos pontos críticos na zona de Brillouin [ 23 - 26 ].

2.4.1. A abordagem pseudopotential locais

Como veremos, na verdade é a transformada de Fourier da pseudopotential que será de interesse, uma vez que o uso de uma base de onda plana essencialmente move tudo no espaço de Fourier (ou representação momentum, mecânica quântica). Cerca de um átomo, em particular no local de r um , o potencial V ( r ) pode ser escrita como
A equação (2.67)
Aqui, G é o conjunto de vetores de rede recíproca e é, em princípio, um conjunto infinito de tais vetores. Veremos mais tarde que um conjunto limitado podem ser introduzidas para limitar a complexidade computacional, embora a precisão significa, evidentemente, melhorar vectores treliçadas como mais recíprocos são usados. O inverso ( 2.67 ) torna-se agora
A equação (2.68)
A quantidade Ω é o volume da célula unitária do cristal, tal como os vectores de rede recíproca são definidos pelas células unitárias do cristal. Torna-se conveniente para trabalhar com os dois átomos por célula unitária do zinco-blenda ou cristais de diamante. Para definir um ponto de referência, vamos encaminhar o vetor da estrutura para o ponto médio entre os dois átomos, que é levado para ser a origem, e ( 2.67 ) torna-se
A equação (2.69)
Nesta equação nós definimos 1 = t e 2 = -t . Nos zinco blende diamante e reticulados, estes dois vectores referem-se às posições dos dois átomos de um conjunto de base. Assim, t = um (111) / 8, ou um oitavo da distância diagonal do corpo da célula de face centrada (isto não é a unidade de célula), enquanto que uma é o comprimento da borda da célula. Neste ponto, é conveniente introduzir os potenciais e simétricas como antisimétrica
A equação (2.70)
de modo que
A equação (2.71)
Se agora inserir as definições ( 2.71 ) em ( 2.69 ), podemos escrever a célula pseudopotential como
A equação (2.72)
Trabalhando com a equação de Schrödinger para o pseudo-função de onda, podemos desenvolver a forma de matriz Hamiltoniano. Para começar, vamos definir uma função de onda plana, em um determinado momento k , encontrando-se dentro da primeira zona de Brillouin, como
A equação (2.73)
Agora, a equação de Schrödinger ( 2.2 ) para esta função de onda se torna
A equação (2.74)
Nós agora premultiply pelo estado adjunto e executar a integração inferir, de modo que os elementos da matriz recíproca entre treliça vectores L e L 'são
A equação (2.75)
Cada equação dentro do chavetas produz uma linha ou coluna da matriz de Hamilton (matriz real não conteria o factor de E que é mostrado para a equação, mas este surge no processo diagonalizacao). Usando ( 2,69 ) e ( 2,72 ), os elementos fora da diagonal pode ser avaliada como
A equação (2.76)
Assim, podemos escolher um coeficiente de Fourier, dependendo da diferença entre L e L ' . A contribuição da diagonal para isto é C (0), que só proporciona uma mudança de energia do espectro total. Normalmente, este é utilizado para alinhar a escala de energia de modo a que o topo da banda de valência encontra-se E = 0. While ( 2,75 ) chama para um número infinito de vetores rede recíproca, normalmente um número finito é usado, e este é grande o suficiente para permitir um certo grau de convergência no cálculo. Um jogo comum é a dos 137 vectores recíprocos treliçadas compostas por os conjuntos (e as variações equivalentes) de vectores (000), (111), (200), (220), (311), (222), (400), (331 ), (420) e (422) (todas em unidades de 2 π / um ).Entre esses conjuntos, a magnitude quadrado ( G - G ') 2 assume valores de 0, 3, 4, 8, 11, 12, 16, 19, 20 ou 24 (em unidades apropriadas). Normalmente, os elementos fora da diagonal são computados apenas para ( G - G ') 2 ≤ 11, como a amplitude de Fourier para os elementos maiores é muito pequena [ 19 , 20 ], e indo além destes três não afectem a estrutura de banda [ 27 ].Um ponto importante a considerar os elementos da matriz é de que os senos e co-senos de ( 2,72 ) desaparecer por um certo número de valores aqui apresentados. No caso de Si, por exemplo, ambos os pseudopotenciais atómicas são iguais, então todos os termos seno desaparecem, e o potencial tem apenas uma soma simétrica. Na estrutura de zinco-blenda, o termo seno desaparece para ( L - L ') 2 = 8, enquanto que os termos de cosseno para desaparecer ( L - L ') 2 = 4 (o último também é verdadeiro na estrutura do diamante).
Na figura 2.13 , mostramos a estrutura de banda para Si, que foi calculado usando o pseudopotential locais descritos nesta seção. Como observado acima, temos apenas três parâmetros para jogar quando nós limitamos os coeficientes de Fourier como ( G - G ') 2 ≤ 11. Os valores utilizados para isso são mostrados na tabela 2.3 .
Figura 2.13. estrutura de banda de Si computadorizada com um pseudopotential local.
Tabela 2.3. parâmetros EPM locais para selecionar semicondutores.
S (3)S (8)S (11)A (3)A (4)Um (11)
Si-3,050.7481.025
GaAs-3,130.1360.8161.10,6850,172
InAs-2,740.1360.8161.0850.380.236
InSb-2,4700,5240.8160.380.236
Na figura 2.14 marcamos o cálculo equivalente para GaAs. Para este último caso, dispomos de seis parâmetros causa das condições assimétricas. Como discutido no início do capítulo, o ajuste tem focado principalmente na posicionando a condução X e L vales correctamente em relação à parte inferior da banda de condução. Ainda é possível ver que o mínimo perto X é, na verdade (na direção Γ) a partir do ponto X reais, um resultado que é improvável. Uma característica surpreendente desta estrutura de banda, em relação ao que, para Si, é a grande lacuna polar que se abre na banda de valência. Isto é visto em quase todos os materiais III-V. Os parâmetros utilizados aqui são também apresentados na tabela 2.3 .
Figura 2.14. estrutura de banda de GaAs computados com um pseudopotential local.

2.4.2. Adição de termos não-locais

Encontra-se geralmente que a pseudopotential local tem alguns problemas na montagem dos dados ópticos disponíveis.Alguns sugeriram que uma maneira de ajustar, por exemplo, a largura da banda de valência é adicionar um termo aos elementos diagonais (energia cinética), substituindo a massa de electrões livres, com um valor ajustado [ 28 ]. No entanto, Pandey e Phillips [ 29 ] observam que não há justificativa física para isso, eo sinal é muitas vezes errado e, portanto, não fornece a correção adequada. Eles sugerem o uso de um pseudopotential nonlocal vez, apontando que em Ge esta fornece um parâmetro adicional que pode representar efeitos repulsivos da 3 d núcleo estados. (Enquanto o núcleo estados são removidas a partir das funções de pseudo-ondas e o pseudopotencial, sabe-se que, muitas vezes, eles hibridizam com a valência s unidos, e irá produzir um efeito. Ver, por exemplo, a discussão em [ 30 ]). Assim , adicionando as correções nonlocal é uma metodologia para tratar os efeitos da d estados em (principalmente) os electrões de valência. No entanto, este argumento é fraco, como deve-se questionar por que ele é usado em Si, onde não há núcleo d estados para se preocupar. O facto é que proporciona um comportamento angular adicional e proporciona um conjunto adicional de parâmetros com os quais a melhorar o ajuste entre a estrutura de banda calculada e os dados experimentais utilizados para conseguir o ajuste.
Para introduzir um efeito não-local (ou variação angular) para a pseudopotential, o pseudopotential locais em si é expandido pela adição de um termo não-local que é expandido em harmônicos esféricos. Mesmo com simetria esférica, sabe-se que a solução para a equação Schrödin envolve variáveis ​​angulares e as soluções angulares são normalmente expressa em termos de ditos harmónicos esféricos. A parte não-local do pseudopotencial para átomo de 1 pode ser escrito em termos de um operador de projeção l para o subespaço lm ( m vai de - l para l ) de harmônicos esféricos com o mesmo valor de l como (aqui vamos seguir o tratamento de [ 29 ])
A equação (2.77)
onde
A equação (2.78)
Aqui, l é um raio efectivo para a harmónica esférica dentro do espírito do potencial muffin lata discutida acima. Uma vez que cada um dos dois átomos contribuirá com um termo de correcção para Nonlocal V ( r ), como em ( 2.72 ), que pode lidar com cada um dos dois termos separadamente e depois combinar os resultados utilizando ( 2.72 ). Aqui, no entanto, usaremos o fator de 1/2, discutido acima, para remover o factor adicional de 2 cm ( 2,72 ) e continuar a interpretar Ω como o volume da célula unitária, o que é a sua definição em [ 29 ]. O elemento de matriz em ( 2.76 ), pode agora ser calculado a partir de ( 2,77 ) conforme
A equação (2.79)
Para continuar, vamos expandir as exponenciais em termos de polinômios de Legendre como
A equação (2.80)
Nesta expressão, que representa o ângulo entre o vector de raio r e do vector impulso K . Como temos duas exponenciais, vamos usar índices negadas e não negadas corresponder às negadas e não negadas G vetores que estão em ( 2.80 ). O operador de projeção em ( 2.80 ) irá selecionar o polinômio Legendre adequada e correspondente esférico Bessel função l , a partir da segunda exponencial em que opera. Em seguida, o elemento da matriz pode ser reescrita como: (usamos a notação reduzida K = K + L e K '= K + L ')
A equação (2.81)
O ângulo pode ser expandida em termos de ângulo e o ângulo entre os dois vectores de movimento, com o termo seno integrando a zero sob a integral tridimensional na equação acima. Assim, temos 
A equação (2.82)
Como é geralmente o caso quando queremos simplificar o cálculo, estamos interessados ​​apenas nos valores de l = 0, 2. O primeiro valor dará uma correção de baixa ordem, enquanto o segundo caso será responsável pela variação angular que se poderia esperar de um d Estado. Para l = 0, a integração ao longo do ângulo é simples e dá um fator de 2. Para o caso de L = 2, pode-se expandir o segundo polinómio Legendre e executar a integração como [ 31 ]
A equação (2.83)
A solução da integração radial remanescente foi dada por Pandey e Phillips [ 29 ], conforme
A equação (2.84)
com
A equação (2.85)
Este resultado foi também encontrado por Chelikowsky e Cohen [ 32 ], embora eles diferem na definição do elemento de volume discutido acima. É importante salientar que as magnitudes nesta última função pode ser igual, mesmo nos elementos fora da diagonal, mas a correcção não-local é aplicada somente a estes, tal como discutimos abaixo.
Não há nada neste derivação para determinar se ou não o elemento diagonal devem ser corrigidas com um termo não-local. No entanto, o elemento da diagonal é uma média de volume (de zero o coeficiente de Fourier), por isso não deve haver nenhuma variação angular a um par d correcção estado. Além disso, é evidente em Pandey e Phillips [ 29 ] que as correcções sejam mais importante com os coeficientes de Fourier superiores (eles citam [ 8 ] e [ 11 ], por exemplo). Na verdade, eles acham que o potencial local equivalente (o que inclui a correção para o comportamento não-local) para Ge tem S (3) aumentou (em magnitude) por apenas 4,4%, enquanto a S (8) é aumentado em 220%, e S (11) em 30%. Como último ponto, uma dependência energética de 0 parece ter sido introduzido por Chelikowsky e Cohen [ 32 ]. Quando este for incluído, temos
A equação (2.86)
Agora, tem de ser lembrado que existe um valor de cada um dos parâmetros para cada um dos átomos. No entanto, para a maioria dos semicondutores .
Na figura 2.15 , o cálculo não local de Si é comparada com o local de uma figura de 2.13 . O cálculo local é mostrada nas curvas de vermelho, enquanto que o Nonlocal é mostrada nas curvas de azul. Existem apenas pequenas diferenças de pormenor entre os dois resultados. No entanto, o ajuste é ainda empírico, então pode-se esperar que este seja o caso, e os coeficientes de Fourier tiveram de ser modificadas para obter este tipo de ajuste, como os termos nonlocal estão incluídos. Para este ajuste foram utilizados os valores mostrados na tabela 2.4 , juntamente com .
Figura 2.15. Comparação do cálculo local (vermelho) pseudopotential para Si com o não-local (azul) um.
Tabela 2.4. parâmetros EPM locais para selecionar semicondutores.
S (3)S (8)S (11)A (3)A (4)Um (11)ABAB
Si-3,050.50,60,20,200
GaAs-2,980.210.8161.30,680.136001.75
InAs-2,790,0960.451.090.430.4080.350.256.813,6
InSb-2,47-0.10.260.8160.480.2360.450.487.486.53
Na figura 2.16 , o cálculo não-local para GaAs é mostrado. Novamente, existem apenas pequenas diferenças de pormenor nestas curvas daqueles da figura 2.14 . No entanto, tem havido uma mudança dos valores dos diferentes parâmetros no cálculo.Para o ajuste mostrado aqui usamos os valores mostrados na tabela 2.4 . Para este material, o principal correcção Nonlocal vem da Um 2 prazo, de modo que um 0 = 0. Na verdade, existem vários conjuntos de parâmetros na literatura, um é dada por Chelikowsky e Cohen [ 32 ].
Figura 2.16. estrutura de banda de GaAs usando o pseudopotential não-local.

2.4.3. A interação spin-órbita

É bem conhecido que a estrutura quântica de átomos podem fazer com que o movimento angular dos electrões de se misturar com o momento angular de spin dessas partículas. Uma vez que as bandas de energia são compostas tanto o s e p orbitais dos átomos individuais nos semicondutores, verificou-se que a interacção spin-órbita também afecta estes cálculos. A interacção spin-órbita é um efeito relativista no qual o movimento angular do electrão interage com o gradiente de potencial confinante para produzir um campo magnético eficaz. Neste campo, então casais para a rotação de uma maneira semelhante ao efeito de Zeeman. Os primeiros trabalhos utilizando o método OPW demonstraram claramente que a interacção spin-orbital foi importante para as propriedades específicas das bandas [ 33 , 34 ]. Não é a menos importante destes efeitos é a separação das bandas triplas no topo da banda de valência, produzindo a assim chamada faixa de cisão . Esta última banda está de alguns meV a uma fração significativa de uma eV em vários semicondutores.
A primeira inclusão das interações spin-órbita em cálculos pseudopotencial para semicondutores é pensado para ser devido a Bloom e Bergstresser [ 35 ], que estendeu a interação Hamiltoniano de Weisz [ 36 ] para materiais compostos. A interacção spin-órbita é conhecido por ser mais forte em átomos mais pesados, de modo que consideravam o material mais pesado InSb e CdTe. Subsequentemente, foi aplicado para a maioria das grandes semicondutores. Em geral, a formulação de Weisz pode ser reescrita como [ 37 ]
A equação (2.87)
onde K e K 'são os vetores de onda deslocado definidas acima ( 2,81 ), P ' l é a derivada do polinômio Legendre e S é o fator de estrutura (o seno e cosseno termos que usamos anteriormente). O termo  é um vetor de 2 × 2 Pauli matrizes de rotação, de modo que a direção do produto cruzado líder escolhe um termo Pauli. Agora, a função de onda é mais complicado. Se usarmos a base 137 de avião discutido anteriormente, em seguida, haverá 137 estados básicos com spin up e outros 137 estados básicos com spin para baixo. Assim, cada onda avião agora está associado com uma função de onda de spin e nossa matriz dobrou na classificação. Uma vez que os elétrons de ligação, estamos interessados ​​em apenas são compostas de s - e p -states, precisamos manter apenas o l = 1 termo em ( 2.87 ). Temos também dois átomos em nossa base, e isso vai levar a valores pares e ímpares para o parâmetro λ l . Com essas mudanças, podemos escrever ( 2.87 ) como [ 37 , 38 ]
A equação (2.88)
Os dois parâmetros são
A equação (2.89)
com
A equação (2.90)
onde os subscritos 1 e 2 correspondem à linha da tabela periódica, em que o átomo de residência e μ e α são dois parâmetros de ajuste. As funções ( 2,90 ) são determinados pelas funções de onda do núcleo para os estados apropriados, como
A equação (2.91)
Nesta equação, j é uma função Bessel esférica e R representa a parte radial da função de onda do núcleo. Pötz Vogl e [ 38 ] mostraram que as funções de ( 2,86 ) pode ser aproximada pelas relações
A equação (2.92)
onde
A equação (2.93)
onde um B é o raio de Bohr e n é o normalizado (com o raio de Bohr) extensão radial das funções de onda do núcleo. Pötz Vogl e [38 ] que originou valores para todos os parâmetros para muitos dos semicondutores tetraedricamente coordenados. Nossas próprias simulações usaram seus valores, mas com uma adaptação para o principal parâmetro de acoplamento μ .SFGR
Na figura 2.17 , as bandas encontradas, incluindo a interacção spin-órbita em GaAs são mostrados. Aqui, o parâmetro de acoplamento μ = 0,0125, um pouco mais forte do que a encontrada por Pötz Vogl e [ 38 ]. Além disso, o parâmetro Nonlocal Btem de ser aumentada para 8,5 para controlar as mudanças de bandas. A abertura da banda de split-off é claramente visto, e no topo da banda de valência é agora apenas duplamente degenerado. No entanto, pode-se ver que essas duas bandas também dividir rapidamente uma vez que um está longe do ponto Γ. Há outras cisões nas bandas que pode ser visto em vários pontos na zona.
Figura 2.17. As bandas de energia em torno do principal mínimos da banda de condução para o GaAs são mostradas para um Nonlocal EPM, incluindo a interacção spin-órbita.

2.5. O k centerdotmétodo p

Embora a interacção spin-órbita é facilmente incorporado dentro do método pseudopotential, e a maioria das outras abordagens computacionais, é muitas vezes tratado por si só como uma abordagem perturbational. Uma razão é a de incluir o nonparabolicity das bandas dentro de uma abordagem analítica a eles. Nós já indicada em ( 2.23 ), no tratamento do modelo quase livre de electrões (secção 2.1 ), que a distância a partir do bordo real das bandas, a dispersão se torne nonparabolic. O nonparabolicity surge a partir da interacção entre as funções das duas bandas que normalmente (sem a abertura) ser degeneradas na extremidade da banda (zona de bordo ou zona central) de onda. Esta interacção continua até que o potencial de cristal abre a abertura. No entanto, a interacção diminui em amplitude como o espaço entre as duas bandas aumenta, e isto faz com que as bandas de a afastar-se menos rapidamente. Em grandes valores do momento, longe da travessia, as bandas de voltar para as bandas de elétrons livres, enquanto uma expansão no pequeno impulso leva de volta para a relação parabólica (2.21 ). A interacção spin-órbita é uma abordagem que acopla perturbative várias bandas, e, portanto, conduz a uma mistura da base s e p estados, o qual altera as misturas dos componentes como o vector de onda, e portanto a energia, é variável.
Foi estabelecido na seção 2.1 acima que as soluções gerais da equação de Schrödinger em um potencial periódico são funções de onda de Bloch. São essas funções Bloch que serão utilizados para definir o Hamiltoniano para o centerdotp método. Aqui, k é o vector de onda que descreve a propagação da onda e que está relacionado com o impulso de cristal do electrão (em qualquer banda está localizado). Por outro lado, p = representa a quantidade de movimento do operador, o qual está relacionado com o movimento no espaço real. Se colocarmos a forma vetorial da função de Bloch ( 2.12 ) para o vetor de Schrödinger ( 2.2 ), vemos que
A equação (2.94)
em que o termo exponencial foi descartada, uma vez que é comum para todos os termos na equação. Isso pode ser reescrita como
A equação (2.95)
Nesta equação, temos revertido para a forma operador do momento, eo prazo de elétrons livres foi incorporada com a energia. O terceiro termo, entre colchetes em ( 2.95 ), é o chamado centerdotp prazo. Como observado acima, o termo é muitas vezes tratada pela teoria de perturbação para construir a massa efetiva de um somatório de perturbação sobre todas as bandas de energia no cristal. Isto não é necessário.Se usarmos uma base limitada definir um procedimento diagonalização pode ser utilizado para incorporar estes termos exatamente. O procedimento que seguimos é devido a Kane [ 39 , 40 ]. A abordagem que seguimos é usar os quatro estados da base que foram utilizados para a aproximação tight-binding na seção 2.3.3 . Isto é, utilizamos quatro orbitais hibridizadas (o que é diferente dos quatro estados em cada átomo de base) para o único s e três p estados. No entanto, estes irão ser dobrada para adicionar a função de onda a cada rotação orbital, como explicado mais abaixo. Antes de continuar lá, no entanto, ainda temos que adicionar os termos de interação spin-órbita ao hamiltoniano em ( 2.95 ).
A interacção spin-órbita vai dividir a triplamente degenerado (seis vezes degenerado rotação quando é tomado em conta) bandas de valência, no máximo, que ocorre no centro da zona (o Γ ponto), como foi discutido na secção anterior. Essa divisão surge em quase todos os semicondutores tetrahedrally coordenados. A interação se divide principalmente fora de um (spin-degenerada) do estado, deixando um duplamente degenerado (quádruplo com spin) conjunto de níveis que correspondem à luz e os buracos pesados. Para responder corretamente para que esse arranjo banda é, assim, necessário incluir a interação spin-órbita em (2.95 ). Esta interacção conduz a duas condições adicionais que surgem a partir de acoplamento do cristal orbital (bem como o electrão livre) impulso e o momento angular de spin (movimento do electrão girando sobre o seu próprio eixo) dos electrões.Estes dois termos são
A equação (2.96)
onde  é o vetor de Pauli matrizes de rotação como o usado na seção anterior. O segundo destes termos dá um termo que é linear em k no centro da zona e, na verdade, desloca os máximos da banda de valência um desprezivelmente pequena quantidade Γ longe, na maioria dos compostos semicondutores, onde não há nenhuma simetria de inversão do cristal. É geralmente um efeito muito pequeno, e este termo pode ser tratada em teoria de perturbação. Quando acoplado com efeitos de bandas de maior altitude, este prazo será muito importante na realmente produzindo uma massa diferente da massa de elétrons livres para a banda heavy-buraco, e esses resultados são discutidos abaixo. Este termo, no entanto, é ignorado nos cálculos apresentados. O primeiro termo da ( 2,96 ) é chamado o k -independente interacção spin-órbita e é o termo principal que deve ser incluído na ( 2,95 ).

2.5.1. Valence e interações banda de condução

É conveniente adotar um conjunto diferente de funções de onda que o conjunto normal de orbitais. Enquanto um pode simplesmente usar o s - e p funções atômicas estatais, a hamiltoniana que resultaria é um pouco mais complexa. Utilizando uma combinação adequada de alguns dos estados que aparece num formato simples. A base sp 3 hibridação da condução e de valência bandas sugere o uso de s , x (vamos designar esta como X ), y ( Y ) e z ( Z ) de funções de onda. Estas funções não são adequadas Bloch, mas têm a simetria dos estados designados banda perto do extrema apropriada e são parte da Bloch estados célula local. As interacções dos quatro ( 2,95 ) e ( 2,96 ) deixar as bandas duplamente (spin) degenerada, o que facilita o problema e o tamanho da matriz de Hamilton para ser diagonalizamos. Como mencionado acima, devemos ter em s e p híbridos para os dois átomos na base separadamente, mas as energias e funções de onda discutidos aqui estão a ser assumida médias adequadas. Para as oito (com centrifugação) estados da base, as funções de onda são agora considerados como os oito funções (a seta indica a direcção do spin do electrão no estado particular) [ 39 , 40 ]
A equação (2.97)
Os quatro estados da coluna da esquerda formam um conjunto de estados, que são degenerados com o conjunto de estados na coluna da direita. Na avaliação da matriz de Hamilton, que será de 8 x 8, o vector de onda é feita na z direcção. Esta selecção é feita por conveniência (que é a direcção normal ao emparelhamento circular do X e Y funções). Pode-se usar uma direcção arbitrária para o impulso, mas a matriz é mais complicado. Por outro lado, o Z -eixo pode ser rodado para uma direcção arbitrária por uma rotação de coordenadas, e isto irá alterar a matriz de Hamilton apropriadamente.
Uma vez que as funções de base duplamente degenerado levar a vários níveis, a 8 × 8 matriz separa-se em uma forma diagonal de bloco simples, contendo dois grupos de 4 × 4 matrizes, uma para cada sentido de rotação. Estes são os blocos na diagonal, e os 4 × 4 blocos fora da diagonal são zero. Assim, cada um dos blocos diagonais se separar por si própria, tendo a forma
A equação (2.98)
O parâmetro Δ é uma quantidade positiva, dado pela
A equação (2.99)
que são os elementos da matriz de ( 2.96 ) com as p funções de onda (o spin é tomado no z direção) normais para k .Empiricamente, esta é a energia desdobramento de spin-órbita que descreve a diferença de energia entre a banda de valência cisão e o topo da banda de valência, e é uma quantidade medida para a maioria dos materiais. O elemento de impulso da matrizP surge a partir da centerdotp prazo ( 2,95 ), e é dada pela
Equação (2,100)
s e p são uma média dos níveis de energia atômica que usamos anteriormente. A quarta linha da matriz ( 2,98 ) é um nível isolado, e é a banda pesada buracos. Uma vez que este nível é isolado no topo da banda de valência, é necessário definir p = .Esta banda de heavy-buraco tem uma energia que é apenas a curvatura de elétrons livres do segundo mandato, em (2.95 ). Infelizmente, essa curvatura tem o sinal errado, um ponto que retornar mais tarde. Uma vez que este escolha o nível de energia é feita, a equação característica para o determinante dos restantes 3 ​​× 3 matriz é
A equação (2.101)
onde a energia reduzida E 'é dado pela expressão nos parênteses no lado direito de ( 2.95 ) e criámos L = s no reconhecimento de que a parte inferior da banda de condução é determinada pela s unidos.
Pequeno kP . Se o tamanho do k termo-dependente ( 2,101 ) é muito pequena (por exemplo, a energia é próximo do extremo da banda), as soluções serão basicamente aquelas resultantes do primeiro termo, com um ligeiro ajustamento para o kP prazo.Para este caso, as três bandas são dadas pelos três zeros da primeira prazo, que conduz a
A equação (2.102)
As três soluções são para a condução, a luz buracos e bandas de cisão (spin-órbita), respectivamente (a banda pesada buracos foi discutido acima). A contribuição de elétrons livres foi restaurado para cada energia a partir de ( 2.95 ). Dentro desta aproximação, as bandas são todos parabólico para pequenos valores de k . Fazemos notar que, em cada caso, a massa efectiva será inversamente proporcional ao quadrado do elemento de impulso da matriz. Por exemplo, para a banda de condução, pode-se inferir a massa eficaz para ser dada pela
Equação (2.103)
e esta massa irá ser consideravelmente menor do que a massa de electrões livres 0 . Do mesmo modo, as massas podem também ser inferida para as outras duas bandas, mas estes valores são ligeiramente diferentes, embora todos eles dependem da diferença de energia e o elemento de impulso da matriz. Perto de k = 0 os efeitos das bandas mais elevadas são relativamente menores.
Δ = 0. O modelo de duas bandas. Se a interação spin-órbita está definido para zero, então a banda cisão torna-se degeneram com as bandas leves e pesados-buraco em k = 0. A interação restante é apenas entre o quase espelho imagem condução e bandas de luz buracos. Neste caso, estas duas energias são dadas pela
Equação (2.104)
A forma geral é aqui apenas uma descrição encontrada em hiperbólica ( 2,20 ) a partir do modelo quase-de electrões livres, com excepção de que a energia de interacção é definido em termos de quantidade de movimento do elemento de matriz e hiato de energia. Podemos usar isso para definir uma massa efetiva na borda da banda (no k → 0 limite). Se expandirmos a raiz quadrada para o pequeno limite argumento, vemos que
A equação (2.105)
Os sinais opostos sobre a massa de electrões livres manter estas duas bandas de serem imagens de espelho puros sobre o centro da abertura de energia.
Δ >> G , kP . No caso em que a divisão de spin-órbita é grande, uma expansão ligeiramente diferente da equação característica pode ser obtida. Para este caso, a energia de spin-órbita é feita para ser maior do que qualquer energia correspondente para o qual é requerida uma solução, e a equação quadrática resultante pode ser resolvido como
A equação (2.106)
ea cisão banda spin-órbita foi antecipada a partir de ( 2.102 ). Notamos aqui que os termos sob a raiz quadrada diferem daqueles em ( 2.104 ) apenas por um fator de 2/3. A condução e light-hole bandas permanecem quase espelham imagens.
Bandas hiperbólicas. Pode ser visto a partir de ( 2.104 ) e ( 2.106 ), que a condução e bandas de luz buracos são essencialmente hiperbólico em forma. A relação entre o elemento de impulso da matriz e as modificações do bordo da banda de massa ligeiramente eficazes com o tamanho da energia de spin-órbita, mas esta mudança é relativamente pequena como o coeficiente numérica dos 2 prazo só muda de um factor de 2/3 como Δ vai de zero a muito grande. O efeito importante nestas equações é a forma hiperbólica banda introduzido pelo kp interacção, e a variação introduzida pela interacção spin-órbita é bastante pequena, excepto o movimento do máximo da banda de cisão longe da banda pesada buracos . Por esta razão, é geralmente decidido introduzir as massas de bordo da banda directamente para a relação hiperbólica sem se preocupar se o tamanho da energia de spin-órbita é significativa. Em seguida, a forma mais comum observado para as bandas hiperbólicas que é de ( 2,104 ), com as massas eficazes dado por ( 2.105 ). Para a maioria dos grupos de semicondutores III-V-gap compostos directa, a condução de luz e buracos banda massas eficazes são pequenos e da ordem de 0,01 a 0,1, de modo que o termo de electrões livres é essencialmente insignificante. Uma vez que o elemento-matriz impulso surge das sp três híbridos, o resultado de ( 2,104 ) é que a escala de massas com a lacuna da banda de uma forma quase linear, com variações modestas do elemento de impulso da matriz. Os materiais com aberturas de banda estreita geralmente têm valores muito pequenos para as massas eficazes.
Muitas vezes é útil para reorganizar as faixas espelhadas, que são hiperbólica na natureza, para expressar a dinâmica do vetor de onda k diretamente em termos de energia. Isso é feito facilmente, usando ( 2.104 ) e ( 2.105 ), com os resultados que
A equação (2.107)
Aqui, devemos lembrar-nos que a energia da banda de condução vai desde um valor de G para cima, como é medido a partir da banda de valência máxima. Se deslocar o ponto zero de energia para a parte inferior da banda de condução, em seguida, os dois termos dos parênteses da primeira linha são invertidos (com uma troca de sinal).
As equações acima não foram corrigidos para as interações com as bandas de maior altitude, uma vez que estes estão além das aproximações utilizadas nesta seção. Pode-se ir além dessa simples de quatro bandas aproximação a uma abordagem de ordem superior. De fato, se a banda de heavy-buraco deve ser corrigido, em seguida, mais bandas são necessários com as interações entre eles manipulados por teoria de perturbação ao invés de diagonalização direta. Em geral, estas levam aos lineares k termos acima mencionados, que são importantes em valores muito pequenos de k na banda de valência. Há também em termos quadrático k que conduzem a variações das massas para além das das bandas hiperbólicos, e termos transversais quadráticas que levam à deformação da banda de distância a partir de uma forma simétrica esférica (em k = 0). Esses termos adicionais são tradicionalmente tratadas através de teoria de perturbação [ 41 , 42 ], geralmente por uma formulação de 16 bandas (oito bandas que estão rotação split) [ 42 ]. O efeito dominante destes termos, no entanto, está nas faixas claras e pesados, buracos, e estes podem ser escritas como [ 42 ]
Equação (2,108)
em que o sinal superior é para os orifícios de luz e menor é a pesada. As constantes A , B e C são conhecidos há muitos semicondutores. Para Si, eles tomam os valores de 4, 1,1 e 4,1, respectivamente.

2.5.2. Funções de onda

As funções básicas de onda que formam a base para o conjunto de k centerdotp método foi dado em ( 2.97 ). Uma vez que as energias se encontram, os valores apropriados dos vetores da base dão os novos vetores de base ortonormais. O duplamente degenerado funções de onda resultantes da diagonalizacao da Hamiltoniana, utilizando os métodos descritos acima, pode ser escrita sob a forma [ 39 , 40 ]
Equação (2.109)
onde o índice i assume os valores C, LH ou Δ , enquanto que os valores 1, 2 correspondem aos dois estados de spin. Estes dão seis das funções de onda. Tal como anteriormente, o vector de onda é orientada na z direcção. As funções de onda pesada buracos são
Equação (2.110)
Finalmente, os coeficientes são escritos em termos de energias das várias bandas como a
Equação (2.111)
A última expressão proporciona a normalização de funções de onda. Para pequenas kP a banda de condução continua s -like, ea luz buracos e split-off bandas de valência são compostos de misturas das p funções de onda-simetria. Nos modelos de banda hiperbólicos, no entanto, a banda de condução também contém uma mistura de p -simetria de funções de onda. Esta mistura é dependente de energia, e é este que apresenta um efeito semelhante (dependente de energia) para a sobreposição integrais calculados para os processos de espalhamento no capítulo anterior. Tal como acontece com os detalhes das bandas hiperbólicos, o tamanho da separação de spin-órbita faz apenas ligeiras alterações nos factores numéricos, mas estes podem ser ignoradas como sendo de segunda ordem de importância.

2.6. A aproximação da massa efetiva

Quando os movimentos de electrões no potencial que surge a partir dos átomos (e das variedades de potenciais electrão-electrão), que tende a seguir as bandas de energia e, assim, não é estacionária no tempo. No entanto, se conectá-lo à função de onda de Bloch, em seguida, senta-se com um impulso de onda e energia correspondente a , e pode ser pensado como sendo parado naquele momento. Neste contexto, a velocidade e detalhada impulso são diferentes das que estão associadas com a função de onda Bloch. Costumamos associar este último com a idéia de uma quase-partícula, que é um quantum de excitação elétron-like dentro do cristal, mas com propriedades que são diferentes do que as do elétron livre, embora este último pode muito bem ser a base sobre a qual as bandas de energia são construídos. No final do dia, porém, precisamos dar o nosso quase-partícula uma eficaz massa para completar a descrição e sua resposta a campos externos e potencialidades. As bandas de energia e o movimento resultante surge do Hamiltoniano expresso em ( 2.2 ), o qual pode ser escrito como
Equação (2.112)
onde o potencial pode ser a pseudopotential, ou uma modificação do mesmo para incorporar alguma forma de as energias de electrões-electrões. A quantidade p é o operador de impulso convencional da mecânica quântica, que é expressa como na forma de vector. Queremos analisar como esse potencial interage com as funções de Bloch e dá origem a uma quase-momentum, que também podemos chamar a dinâmica de cristal [ 43 ]. A abordagem que seguimos é baseada em idéias de [ 43 ], mais recentemente discutido em [ 44 ].
Notamos que o operador momento aparecendo no Hamiltoniano ( 2.112 ) na verdade não comutam com este Hamiltoniano. Em vez disso, vemos que
A equação (2.113)
Da mesma forma, a velocidade do electrão no cristal também não comuta com o Hamiltoniano, conforme
A equação (2.114)
O problema que temos é que, uma vez que a energia é uma constante do movimento, enquanto nos movemos através do potencial espacial variando o ritmo (e, portanto, a velocidade) também devem variar espacialmente. Assim, estes são propriedades oscilatórias que variam conforme os movimentos de electrões através das bandas de energia do cristal. A resposta de oscilação, que é periódica na periodicidade de cristal, tem sido chamado de oscilação Bloch. No entanto, estes não são as propriedades que se pretende para a quase-partículas para ser usado em, por exemplo, cálculos de transporte. Então, para ver como abordar este vamos voltar atrás e examinar as funções de Bloch ( 2.12 ) um pouco mais. Aqui, vamos utilizá-los na forma de vetor.
As funções de Bloch deve ser autofunções do Hamiltoniano, como utilizá-los para produzir as bandas de energia nos últimos seções. Assim, devemos ter
Equação (2.115)
onde o  tem a periodicidade da célula unitária do cristal. Agora, o número de onda k tem algumas propriedades interessantes
Equação (2.116)
onde λ é o comprimento de onda de Broglie e P é a quase-impulso, para ser distinguido do operador no momento ( 2.113 ). A quasi-momento surge a partir da parte de onda da função de Bloch e terá algumas propriedades diferentes do que o operador momentum, ou impulso real. Uma vez que a quantidade é uma quantidade relativamente estacionário, a quase-impulso deve ser uma constante do movimento, e não oscile através da banda com o tempo. Isto decorre, como a função de Bloch si é estacionário para uma dada k estado. Por exemplo, o seguinte ( 2,116 ), a função de Bloch também satisfaz a equação eigenvalor
Equação (2.117)
Mecânica quântica, a função de onda pode satisfazer duas equações de valores próprios apenas se a comutar operadores.Assim, a semi-impulso deve comutar com o na de Hamilton ( 2,112 ) e, assim, ser uma constante do movimento. Deve haver uma relação entre esta quase impulso e o operador de impulso. Então, vamos escrever
A equação (2.118)
em que o último termo deve ser determinada. Para fazer isso, esta equação aplica operador para a função Bloch-se, o que leva a
A equação (2.119)
Para a equação de autovalor ( 2,118 ), a ser satisfeita, o termo entre colchetes deve desaparecer, e isso nos dá
A equação (2.120)
Se, agora, adicionar um potencial externo para o cristal, o Hamiltoniano total pode ser reescrita, incluindo este termo extra tão
Equação (2.121)
Com este novo Hamiltoniano, descobrimos que o quasi-momentum varia de acordo com o potencial externo como
A equação (2.122)
onde usamos ( 2.118 ) e ( 2.119 ) eo último termo de ( 2.118 ) comuta com o potencial externo. Assim, a semi-impulso é alterado apenas pela força externa não periódica. Assim, relaciona a semi-impulso para a quase-partícula de electrões através do estado de Bloch, de modo que seja acelerado apenas pelos campos externos e seu movimento médio na ausência destas é uma constante do movimento.
Voltemos agora à velocidade. Como é bem conhecido na mecânica quântica, podemos expressar a variação do tempo de um operador que não é explicitamente em função do tempo por meio da notação como Heisenberg
Equação (2.123)
Vamos agora tomar a expectativa deste operador usando as funções de onda de Bloch. Isto leva a
Equação (2.124)
que é um resultado independente do tempo. Assim, a velocidade média é constante (na ausência de campos externos), devido à equação eigenvalor ( 2,115 ) e as propriedades das funções Bloch. Se colocarmos a função full Bloch em ( 2.115 ) e encontrar a equação de autovalor resultante para apenas a parte periódica da célula, obtemos
Equação (2,125)
Com esta expansão do Hamiltoniano podemos escrever
Equação (2,126)
O valor da expectativa deste último prazo, avaliada com as peças periódicas celulares da função Bloch, dá
Equação (2.127)
Esta última expressão, pode ser combinado com o ( 2,114 ), para dar a velocidade média, em termos de energia das bandas como
Equação (2,128)
Assim, a velocidade de quase-partícula média é dada pelo ponto derivado da energia como uma função do quase-impulso.
À medida que a velocidade média do quase-partícula é dada pela derivada da energia no que diz respeito à semi-impulso, isto significa que tem de estar directamente relacionada com a quase-impulso, o que nos permite definir este através de uma relação de massa efectiva :
A equação (2.129)
Esta deve ser considerada como a definição fundamental da massa eficaz para o electrão quase-partícula. Ela é diferente para cada faixa, assim como a função de Bloch e o quase-impulso são (e cada impulso k ). No entanto, isso é dramaticamente diferente do que é comumente encontrada em livros didáticos. Aqui, fazemos a definição baseada na existência da velocidade quase impulso e média, que descrevem o movimento de nosso quase-partículas resultantes da função Bloch.
É importante notar que, se combinar ( 2.129 ) com ( 2.128 ), podemos escrever uma expressão para a massa em termos de bandas de energia como
A equação (2.130)
para uma banda esfericamente simétrica. Notamos ainda que existe um problema na parte inferior da banda, em que tanto o derivado e k desaparecer ( k é definido a partir do ponto da banda mínima). Nesta situação, nós achamos que devemos usar a regra de L'Hospital's e tomar as derivadas do numerador e denominador em relação ao k , e isso leva a
A equação (2.131)
Deve ser lembrado que esta é uma forma limitante, válida apenas na parte inferior da banda de condução (ou, de modo equivalente, no topo da banda de valência). No entanto, esta última forma é a encontrada na maioria dos livros didáticos, sem qualquer discussão sobre a sua gama de validade. É interessante notar que a maioria das derivações comuns desta última expressão tem alguns erros neles que obscurecem essas limitações, fato que exige a presente abordagem. É importante ressaltar que a primeira missa derivativos ( 2.130 ) tem sido conhecido como o ciclotron massa [ 45 ], como ciclotron de ressonância mede a área da seção transversal da superfície de energia, e isto está relacionado com a massa acima.

2.7. Ligas de semicondutores

2.7.1. A aproximação de cristal virtuais

Agora devemos estar confortável com a idéia de que a rede de zinco-blenda é composto de duas estruturas FCC se interpenetram, um para cada átomo na base. Assim, o GaAs, por exemplo, uma estrutura de FCC é constituído pelos átomos de Ga, enquanto que a segunda é constituída por AS. Podemos estender este conceito para o caso de ligas pseudo-binários, como GaInAs ou GaAlAs, que devem ser formuladas por uma mistura lisa dos dois componentes (por exemplo, GaAs e ALAS em GaAlAs ou GaAs e InAs em GaInAs) . Em tal x B 1 - x C ligas, todos os locais de uma subrede FCC são ocupadas por átomos de tipo C, mas os locais da segunda sub-reticulado são compartilhados pelos átomos de tipos A e B de uma forma aleatória ao sujeito condições
Equação (2.132)
Neste arranjo, um tipo C omo pode ter todo o tipo A ou de todos os vizinhos do tipo B vizinhos, mas, em média, tem uma fracção de x do tipo A vizinhos e uma fracção de 1 - x do tipo B vizinhos. Com efeito, a estrutura é uma estrutura mista de FCC A-C e B-C , as moléculas completas com ligação molecular interpenetrante. Esta estrutura compõe o que é chamado de uma liga binária de pseudo-, com as propriedades de determinados pelas concentrações relativas de A e B átomos. Nas ligas verdadeiras pseudo-binária, deve ser possível para dimensionar as propriedades de uma extrapolação suave entre os dois compostos de ponto final, mas isto nem sempre é o caso.
Nos últimos anos, as ligas quaternárias também apareceram como um x B 1 - x 1 - y (o exemplo mais comum é o InGaAsP quaternário, usado em emissores de luz infravermelha). Aqui, C e D átomos partes dos locais, em um sub-reticulado, tal como aA e B partilhada outro sub-reticulado, tal como descrito acima. Este novo composto é ainda considerado como um composto de pseudo-binária composto por uma mistura aleatória de dois ternários x B 1 - x C e x B 1 - x D , que são apenas um pouco mais complicado do que os simples discutidas no parágrafo precedente . Ainda assim, presume-se que uma mistura aleatória verdadeiro ocorre de modo que as propriedades podem ser interpoladas a partir facilmente os dos compostos constituintes. Isto é, a aleatoriedade da liga impede qualquer correlação ocorrendo entre os vários átomos, com excepção de que a estrutura de cristal. Então, qualquer teoria geral das ligas pseudo-binárias pode ser aplicado igualmente bem para ambos os quaternários e ternária. Se estes compostos são misturas verdadeiramente lisas, a teoria liga vai realizar, mas se houver qualquer ordem ou correlação na distribuição dos dois componentes, os desvios deve ser esperado. Por exemplo, Na x Ga 1 - x Como pode ser uma liga suave composto por uma mistura aleatória de InAs e GaAs. No entanto, se ordenação perfeito ocorrer, particularmente perto de x = 0,5, a estrutura de cristal que não seja uma estrutura de zinco-blenda, mas seria um calcopirita-superrede uma sobre a estrutura de zinco-blenda com uma distorção significativa da unidade de célula ao longo de um dos eixos principais. Neste caso, as alterações são esperadas na estrutura de banda devido a zona de Brillouin dobrável em torno do eixo alongado (o período da estrutura é agora o dobro do tempo, o que coloca a extremidade da zona de Brillouin apenas metade tão longe da origem o sentido de espaço recíproco ortogonal). Durante muitos anos, tem-se assumido que os compostos ternários e quaternários formados os grupos de compostos III-V são verdadeiras ligas aleatórios. Em tempos recentes, no entanto, tornou-se evidente que este não é o caso em muitas situações. Voltaremos a esta abaixo, pois dá algumas dicas sobre os desvios esperados a partir da teoria liga aleatória.
Considere-se uma liga de pseudobinary em que os A-C e C-B moléculas são colocadas aleatoriamente na rede cristalina.Atenção será focada em ternários, mas a abordagem é facilmente estendido para quaternários. A contribuição para o potencial de cristal para os A e B átomos pode ser escrita como
A equação (2.133)
onde 0 define o sítio da rede da subrede específica na qual os A e B são átomos localizados aleatoriamente. Esta parte do potencial de cristal total pode agora ser decomposto em partes simétricas e anti-simétrica. O primeiro é o potencial "virtual de cristal ', e o último é um potencial aleatório, cuja média se presume ser suficientemente pequena para que ele possa ser desprezada, mas fornece frequentemente chamado espalhamento liga. Esta decomposição é apenas
Equação (2.134)
em que um e B são definidos em ( 2.132 ). O potencial virtual de cristal, que é o potencial simétrica, é uma interpolação suave entre os potenciais para a A-C e C B- cristais. A parte aleatória pode contribuir para a dispersão de qualquer um dos veículos ou encurvamento dos níveis de energia no cristal misto. Curvando-se de um gap significa um desvio da extrapolação linear.Normalmente, isso é se curvar em direção a uma lacuna que é mais estreito do que o previsto pela aproximação virtual de cristal.Isto é, pode diminuir a diferença, o que indica um aumento da estabilidade, da liga de forma aleatória. Se houver uma regularidade de Um , ou B , de modo que eles possuem uma amplitude significativa em um dos componentes de Fourier, que vai ter um impacto significativo sobre as funções de Bloch e estrutura de banda. Assim, uma definição de uma liga de forma aleatória é que é aquela em que o potencial anti-simétrica é suficientemente aleatório para nenhum dos componentes de Fourier para ser excitado com qualquer grande grau. Isto significa que o potencial anti-simétrica tem de ser aperiódica na natureza.
As medições experimentais da variação da lacuna da banda de uma liga típica pode ser expresso de forma bastante geral quanto
Equação (2.135)
A forma geral de ( 2,135 ) é encontrado em quase todas as ligas, por exemplo, existe uma interpolação linear prazo entre os dois compostos de terminal que representa a aproximação cristal virtuais (os dois primeiros termos da equação), e uma energia de arqueamento negativo ( coeficiente do x (1 - x ) termo) que representa a contribuição do potencial anti-simétrica não correlacionado.
Nos compostos quaternários é necessário para extrapolar a lacuna da banda e as constantes de rede a partir dos ternários.Existem muitos materiais ternários possíveis, cujo número é aproximadamente o da binários elevado à potência 3/2.Normalmente, no entanto, elas são cultivadas reticulado corresponde a algum substrato binário. Nas ligas, uma regra conhecida como a lei de Vegard estipula que a constante de rede varia linearmente entre os valores dos dois parâmetros [ 46 ]. Por exemplo, as arestas da FCC em GaAs, InP InAs e são encontrados em cerca de 5,65 Á, 6,06 Â e 5,87 Á, respectivamente [ 15 ].Entre as propriedades da estrutura do FCC, podemos encontrar a constante das extremidades do cubo da estrutura para ser 5,66 Á, 6,07 Â e 5,85 Á, respectivamente. A constante de estrutura Ga x In lx Como é, portanto,
A equação (2.136)
e isto é combinado com InP reticulado para x = 0,53. Assim, esta composição da liga pode ser cultivada em InP, sem introduzir qualquer pressão significativa para a camada.

2.7.2. Liga de ordenação

Como discutido acima, é muito possível que estes compostos não são ligas de ligas perfeitamente aleatório, mas, de facto, possuem alguma ordem na sua estrutura. A base de ordenação em ligas de outro modo aleatórios reside no facto de a estrutura ordenada, se tem ordem de curto ou longo prazo, pode estar num estado de energia mais baixo do que a liga perfeitamente aleatória. Em uma liga aleatória Um x B 1 - x C , a média da energia coesiva mudará por
Equação (2.137)
dentro da aproximação cristal virtual. Enquanto a A-C composto está a perder a energia, o B-C é a obtenção de energia, e esta energia provém da expansão ou contracção da estrutura dos dois compostos finais (e isto produz a variação na estrutura de energia). Por exemplo, em De x Ga 1 - x Como a energia de coesão é a média daqueles para o GaAs e InAs, mas o ganho de energia sob a expansão da rede de GaAs é exactamente compensado pelo que absorvida na compressão da estrutura InAs, pelo menos dentro da aproximação linear da aproximação virtual cristal.
Se qualquer ordem de curto alcance, existe, no entanto, este argumento não se sustenta mais. Em vez disso, as regiões de GaAs ordenados sofrer uma perda de energia como suas ligações são esticados na liga, enquanto que a ordenada InAs regiões ganho de energia como as ligações são comprimidas (aqui um ganho de energia, deve ser interpretado no sentido de que o cristal é comprimido e o estado de equilíbrio tem agora um estado de baixa energia). Pode-se assumir que a energia de coesão varia de 1 / 2 em teoria mais simples, em que d é uma distância interplanar. Este comportamento é encontrada para a maior parte das outras energias de interacção no cristal. Assim, uma alteração líquida de energia coesiva nos compostos semicondutores é um cálculo simples. No entanto, a constante de rede e, consequentemente, d , varia linearmente a partir de um composto para o outro, devido à lei de Vegard. No entanto, a energia de coesão varia de acordo com o inverso do quadrado da mudança na constante de rede. Assim, não é garantido que a variação da energia coesiva seguirá a lei linear simples dado por ( 2.137 ).
A banda de valência realmente contém apenas os 8 N (onde N é o número de células unitárias na estrutura) electrões em equilíbrio. Como um ligas dois compostos, a posição absoluta da banda pode mover-se, obtendo-se uma alteração na média de energia dos electrões de ligação. Isso é ignorado quando tomamos o topo da banda de valência, como o zero de energia. Na verdade, as energias absolutas de um composto em relação ao outro torna-se importante para a estabilidade da liga Uma diminuição na média de energia da banda de valência, ou um aumento de energia coesiva, indica que a ordenação na liga é energeticamente favorecida. É evidente que existem algumas ligas em que ordem é energeticamente favorecida. Os dados sobre a GaAIAs são misturados, mas, mesmo se ocorrer, seria apenas a baixas temperaturas. Neste caso, os cálculos de energia total de apenas muito realista podem lançar luz sobre a estabilidade da liga de forma aleatória. A situação experimental não foi investigada de forma eficaz, com exceção de alguns casos especiais.
No caso de InGaAs, InGaSb e INASP, todas as indicações sugerem que a liga vai favorecer a separação das fases e ordena à temperatura ambiente. Com efeito, esta tendência para ordenar os compostos em InGaAs INASP e pode produzir a diferença miscibilidade bem conhecido na liga quaternário InGaAsP que se encontra na gama de 0,7 < y <0,9. A verdadeira natureza de qualquer ordem que ocorre pode ser muito subtil, no entanto. Como um exemplo, em experiências pioneiras com absorção de estrutura fina medições de raios-x (XAFS) em InGaAs, Mikkelsen e Boyce [ 47 ] verificaram que, aparentemente, o GaAs e InAs vizinhos mais próximos comprimentos de ligação permanecer praticamente constante para os valores binários (o covalente raios) para todas as composições de liga. A distância média cátion-ânion segue a lei e aumenta em 0.174 um Vegard. A subrede cação se parece muito com um cristal virtual (esta é a subrede em que liga ocorre), mas a subrede ânion é muito distorcida devido à tendência anterior. A distorção leva a dois-A como (segunda vizinho) distâncias que diferem em até 0,24 Â, e a distribuição dos observados distâncias segunda vizinho tem um perfil gaussiano sobre os dois valores distintos. A distorção da subrede anião é claramente para além da aproximação virtual cristal, e uma tal estrutura pode ser acomodado num cristal modelo que se assemelha ao de uma distorção de calcopirite, e pode, de facto, explicar a observável encurvamento da estrutura da banda. Se estas observações são transportados para outras ligas, semicondutores, é provável que aqueles em que a liga é entre dois átomos de dimensões muito diferentes, a distância do vizinho mais próximo, provavelmente, preferem adotar o valor binário.
Zunger e seu colegas de trabalho [ 48 - 51 ] levou essas idéias teóricas muito mais em uma investigação da liga do grupo de semicondutores III-V. Na maioria dos argumentos acima temos apenas olhou para a compressão / expansão da rede cristalina global dos dois componentes binários média, e não ter incluído a tendência para a distância média do vizinho mais próximo para permanecer no valor de binário. Para isto ocorrer, deve haver um abrandamento da subrede constituinte comum dentro da célula unitária, bem como uma eventual transferência de carga entre os vários átomos comuns na subrede nonalloyed. Na verdade, esses autores concluem que estes últimos fatores são dominantes em liga de ordenação. Eles investigaram a tendência para a ordem através da adopção de um cálculo de energia total usando o método pseudopotential não local, o cálculo da energia total para uma dada composição de liga e, em seguida, variando as posições atómicas para averiguar o estado mais baixo de energia. Isto provou ser uma abordagem muito poderoso.
Vamos considerar os argumentos acima de Zunger e seus colegas de trabalho para a maneira pela qual pode ocorrer ordenação. Para um x B 1 - x C liga, os quatro catiões do tipo A e B por célula FCC pode assumir cinco arranjos ordenados vizinhos mais próximos diferentes em torno do C omo: Um 4 , um BC 4 , 4 , AB 4 e 4 . Estes são denotados n = 0, 1, 2, 3, 4 arranjos. Obviamente, n indica o número de B átomos no cluster. Se o sólido for perfeitamente ordenada com estes arranjos (que correspondem directamente a x = 0, 0,25, 0,5, 0,75 e 1,0, respectivamente), as estruturas de rede são zinco blenda apenas para n = 0 ou 4. Para as outras composições a estrutura cristalina ordenada é conhecida como o luzonite ou famatinite para n = 1 ou 3, e ou Cuau-I ou calcopirite para n = 2. A escolha da estrutura de cristal em particular é o que é dominada por a configuração de energia mais baixa para o cristal. Em qualquer caso, pensa-se agora que uma combinação desordenada ou aleatória deve ser uma mistura estatística de diversas destas estruturas cristalinas. Isto sugere que as ligas altamente ordenada pode gerar novos tipos de superlattices com períodos muito curtos. Com efeito, as experiências foram observadas a altamente ordenadas x = 0,5 estrutura em ambos GaAsSb [ 52 ] e GaAIAs [ 53 ]. No primeiro caso, tanto Cuau-I e estruturas calcopirite são observados, enquanto que apenas a estrutura Cuau-I parece ser encontrada no último caso. Além disso, a estrutura famatinite tem sido observada na liga de InGaAs para x = 0,25 e 0,75 [ 54 ]. É claro que as ligas binárias de semicondutores pode ser qualquer coisa, mas de natureza aleatória e podem ser bastante diferentes dos cristais simples virtuais que estão a ser feitas. Mbaye et al [ 51 ] calculados os diagramas de fase para várias ligas utilizando o método total de energia discutido anteriormente e descobriram que as ligas aleatórias ordenadas ligas e as lacunas miscibilidade podem ocorrer, e que a estirpe pode, na verdade, estabilizar os compostos estequiométricas ordenados.

Problemas

1.O modelo de Kronig-Penney para bandas de energia utiliza um potencial retangular e bem, para o qual
Resolver a equação de Schrödinger para este sistema em cada uma das várias regiões e combinar as funções de onda e derivados em cada interface. Usando o limite de muito grande 0 e desaparecendo d , mostram que um conjunto de bandas permitido e proibido resultado.
2.Calcular a proporção da energia cinética no canto de uma zona de Brillouin cúbico (em [111]), para que o centro de uma face quadrada ao longo de (100).
3.Usando o s e p energias da tabela 2.1 , calcule a diferença de energia em k = 0 para Si, GaAs, InAs e InP.
4.Construir um simples programa de computador para calcular as bandas de energia firme de ligação para Si e InP em toda a zona de Brillouin. Usar os dados apresentados nas tabelas 2,1 e 2,2 para os parâmetros.
5.Construa as somas Bloch para as interações de segunda vizinho na teoria de ligação forte. Usando apenas as duas constantes adicionais dominantes, como discutido por Slater e Koster ([13] do capítulo 2), calcular a estrutura de banda para Si. A banda de condução mínimos podem ser colocados nos locais adequados com esta abordagem?
6.Construir um simples programa de computador para calcular os empíricos bandas de energia pseudopotencial locais para Si e InP em toda a zona de Brillouin. Usar os dados apresentados na tabela 2.3 para os parâmetros.
7.Com a estrutura de banda determinada problema 6, variar os diferentes parâmetros e traçar o movimento dos três principais mínimos da banda de condução (em relação à parte superior da banda de valência) como uma função de cada parâmetro.
8.Um semicondutor particular tem m * = 0,015 0 e G = 0,22 eV. Encontre o potencial de interação G ea energia do elétron livre G / 2 para estes estados no modelo quase-free-elétron simples.
9.Um semicondutor de fenda estreita é caracterizada por uma banda de condução sob a forma de nonparabolic
Calcule a massa efectiva como uma função da energia portadora.
10.Para as bandas de energia determinados no problema 6 para InP, plotar a banda de condução em torno do ponto Γ para uma pequena gama de impulso nos [100] e [111] as direções. Determinar a massa efectiva a banda mínima por encaixe (2,107) para as curvas.
11.Começando com o conceito de velocidade de grupo de os electrões e a sua relação com a energia de superfície, mostram que a massa ciclotrão satisfaz
onde A é a área delimitada pela órbita ciclotrão. (Dica: use a propriedade que
por um integral de superfície em geral.)
12.Como uma mudança na estrutura constante, os elementos da matriz de interação (entre os diferentes átomos) variam, em geral, como 1 / 2 . Use o tight-binding para calcular a estrutura de banda de InAs e GaAs, utilizando os parâmetros no capítulo 2. Em seguida, estimar a estrutura de banda de In 0,75 Ga 0,25 A, que é cultivado num substrato de InP modo que a estrutura é crescido sob tensão de compressão. Você pode assumir esse estresse é hidrostática (homogênea).(Nota:. Primeiro que a liga unstrained através da aproximação aleatória liga, em seguida, calcular os resultados de comprimir a rede para combinar com a rede InP constante)
13.Considere-se um fio quântico cujo eixo é dirigido ao longo do y eixo do sistema de coordenadas. O cabo é formado por uma parede de confinamento mole em que o potencial é descrito por confinante
com ω 0 = 9,1 × 10 12 s -1 e m * = 0,02 0 . O fio é submetido a um campo magnético na z direcção (normal ao eixo do arame). Pode supor-se que a propagação ao longo do fio é uma onda plana de número de onda k . Lote (a) A energia das menores cinco sub-bandas como uma função do campo magnético (até 10 t), e (b) a energia da sub-bandas menores em função do k em B = 3 e 7, a temperatura T. Assuma é de 10 mK.

Referências

[1]
Dirac PAM 1967 Os Princípios da Mecânica Quântica (4 ed) (Oxford: Oxford University Press)
[2]
Merzbacher E 1970 Mecânica Quântica (2 ed) (New York: Wiley)
[3]
JM Ziman 1963 elétrons e fônons (Oxford: Oxford University Press)
[4]
Martin RM 2004 Estrutura Eletrônica (Cambridge: Cambridge University Press)
[5]
Kohanoff J 2.006 cálculos de estrutura eletrônica para sólidos e moléculas (Cambridge: Cambridge University Press)
[6]
Hedin L 1965 Phys. Rev. A 139 796CrossRef
[7]
Stadele M, Majewski JA, Vog P e Göring A 1997 Phys. Rev. Lett. 79 2089CrossRef
[8]
Kittel C 1986 Introdução à Física do Estado Sólido (6 ed) (New York: Wiley)
[9]
Castro Neto AH, Guiné F, NMR Peres, KS Novoselov e Geim AK 2009 Rev. Mod. Phys. 81 109CrossRef
[10]
Wallace PR 1947 Phys. Rev. 71 622CrossRef
[11]
KS Novoselov, Geim AK, SV Morozov, Jiang D, Katsnelson MI, Grigorieva IV, Dubonos SV e Firsov AA 2005 Nature 438197CrossRef
[12]
Khoshnevisan B e Tabatabaean ZS 2008 Appl.Phys.92 371CrossRef
[13]
JC Slater e Koster GF 1954 Phys. Rev. 94 1498CrossRef
[14]
Vogl P, Halmerson HP e Dow JD 1983 J.Phys.Chem.Sólidos 44 365CrossRef
[15]
Sankey DE e Niklewski DJ 1989 Phys. Rev. B 40 3979CrossRef
[16]
Lewis JP, Jelenik P, Ortega J, Demkov AA, Trabada DG, Haycock B, Wang Ha, Adams G, Tomfohr JK, Abad E, Wong Ho e Drabold DA 2011 Phys. Status Solidi b 248 1989CrossRef
[17]
O Madelung 1996 Dados Semiconductors-Basic (Berlin: Springer)
[18]
Chadi DJ e Cohen ML 1975 Phys. Status Solidi b 68 405CrossRef
[19]
Teng D, Shen J, Newman KE e Gu BL 1991 J.Phys.Chem.Sólidos 52 1109CrossRef
[20]
Slater JC 1937 Phys. Rev. 51 846CrossRef
[21]
Herring C 1940 Phys. Rev. 57 1169CrossRef
[22]
Phillips 1958 JC Phys. Rev. 112 685CrossRef
[23]
Brust D, Phillips JC e Bassani F 1962 Phys. Rev. Lett. 9 94CrossRef
[24]
Brust D 1964 Phys. Rev. A 134 1,337CrossRef
[25]
Cohen ML e Phillips 1965 JC Phys. Rev. A 139 912CrossRef
[26]
Cohen ML e Bergstresser TK 1966 Phys. Rev. 141 789CrossRef
[27]
Kane OE 1966 Phys. Rev. 146 556CrossRef
[28]
Chelikowsky J, DJ Chadi e Cohen ML 1973 Phys. Rev. B 8 2786CrossRef
[29]
Pandey KC e Phillips 1974 JC Phys. Rev. B 9 1552CrossRef
[30]
Persson C e Zunger A 2003 Phys. Rev. B 68 073.205CrossRef
[31]
A Erdelyi (ed) 1981 funções transcendentais Superior (Malabar, FL: Krieger)
[32]
Chelikowsky JR Cohen e ML 1976 Phys. Rev. B 14 556CrossRef
[33]
Falicov LM e Cohen MH 1963 Phys. Rev. 130 92CrossRef
[34]
Liu L 1962 Phys. Rev. 126 1.317CrossRef
[35]
Bloom S e Bergstresser TK 1968 Solid State Commun. 6 465CrossRef
[36]
Weisz L 1966 Phys. Rev. 149 504CrossRef
[37]
De A e Pryor CE 2010 Phys. Rev. B 81 155210CrossRef
[38]
Pötz W e Vogl P 1981 Phys. Rev. B 24 2025CrossRef
[39]
Kane EO 1957 J.Phys.Chem.Sólidos 1 249CrossRef
[40]
Kane OE 1966 Semicondutores e semimetais Vol. 1 , ed RK Willardson e AC Beer (New York: Academic) pp 75-100
[41]
Dresselhaus G, Kip AF e Kittel C 1955 Phys. Rev. 98 368CrossRef
[42]
Yu PY e Cardona M 2001 Fundamentos de Semicondutores (Berlin: Springer)
[43]
Smith AR 1961 Onda Mecânica dos sólidos cristalinos (Londres: Chapman and Hall)
[44]
Zawadzki W arXiv: 1209.3235v1
[45]
C Kittel 1963 Teoria Quântica de Sólidos (New York: Wiley) p 227
[46]
Vegard L 1921 Z. Phys. 5 17CrossRef
[47]
Mikkelson JC e Boyce JB 1983 Phys. Rev. Lett. 49 1412CrossRef
[48]
Zunger A e E Jaffe 1984 Phys. Rev. Lett. 51 662CrossRef
[49]
Srivastava GP, Martins JL e Zunger A 1985 Phys. Rev. B 31 2561CrossRef
[50]
JL Martins e Zunger A 1986 Phys. Rev. Lett. 56 1400CrossRef
[51]
Mbaye AA, Ferreira L e Zunger A 1986 Appl.Phys.Lett. 49 782CrossRef
[52]
Jen HR, Cherng MJ e Stringfellow GB 1986 Appl.Phys.Lett. 48 782CrossRef
[53]
Kuan TS, TF Kuech, Wang WI e Wilkie EL 1985 Phys. Rev. Lett. 54 201CrossRef
[54]
Nakayama H e H Fujita 1986 Inst.Phys.Conf.Ser. 79 289

Nenhum comentário:

Postar um comentário