Merge branch 'abdallah' into 'master'

Fixed DGEMM See merge request AbdAmmar/qmcchem!1
2024-12-22 12:23:30 +01:00 · 2021-05-31 12:49:32 +00:00 · 2021-05-31 12:49:32 +00:00 · b45010f15a
commit b45010f15a
parent 1b9215d45c 715b198eaa
5 changed files with 614 additions and 317 deletions
--- a/configure.sh
+++ b/configure.sh
@ -39,11 +39,11 @@ export PATH="\${QMCCHEM_PATH}/bin:\${PATH}"
 export LD_LIBRARY_PATH="\${QMCCHEM_PATH}/lib:\${LD_LIBRARY_PATH}"
 export LIBRARY_PATH="\${QMCCHEM_PATH}/lib:\${LIBRARY_PATH}"
 export QMCCHEM_MPIRUN="mpirun"
-export QMCCHEM_MPIRUN_FLAGS="--bind-to-core"
+export QMCCHEM_MPIRUN_FLAGS=""
 export C_INCLUDE_PATH="\${QMCCHEM_PATH}/include:\${C_INCLUDE_PATH}"
 #export QMCCHEM_NIC=ib0
 source \${QMCCHEM_PATH}/irpf90/bin/irpman
 #source \${QMCCHEM_PATH}/EZFIO/Bash/ezfio.sh
-eval $(opam env)
+eval \$(opam env)
 EOF

--- a/src/PROPERTIES/properties_buildpsi.irp.f
+++ b/src/PROPERTIES/properties_buildpsi.irp.f
@ -0,0 +1,312 @@
+
+BEGIN_PROVIDER [ double precision, hij_fm, (size_hij_fm) ]
+
+  implicit none
+
+  BEGIN_DOC
+  ! !!!
+  ! hij  =  < psi_svd J | H | J l l' > / < psi_svd J | psi_svd J > 
+  !      =  < H (J l l')/(psi_svd J) >    ( first method: fm )
+  !      =  < E_loc (l l') / psi_svd >    ( secnd method: sm )
+  ! Dimensions : n_svd_toselect
+  END_DOC
+
+  integer          :: i, l, lp, e
+  double precision :: f, g, h, T, V
+
+  do i = 1, n_svd_toselect
+
+    l  = psi_svd_alpha_numtoselect(i,1)
+    lp = psi_svd_beta_numtoselect (i,1)
+
+    ! Lapl D 
+    g = 0.d0
+    do e = 1, elec_alpha_num
+      g += det_alpha_grad_lapl_SVD_unique(4,e,l) * det_beta_value_SVD_unique(lp)
+    enddo
+    do e = elec_alpha_num+1, elec_num
+      g += det_alpha_value_SVD_unique(l) * det_beta_grad_lapl_SVD_unique(4,e,lp)
+    enddo
+    T = g
+
+    ! D (Lapl J)/J
+    g = 0.d0
+    do e = 1, elec_num
+      g += jast_lapl_jast_inv(e)
+    enddo
+    T += det_alpha_value_SVD_unique(l) * det_beta_value_SVD_unique(lp) * g
+
+    ! 2 (grad D).(Grad J)/J
+    g = 0.d0
+    do e = 1, elec_alpha_num
+      g += det_alpha_grad_lapl_SVD_unique(1,e,l) * jast_grad_jast_inv_x(e) + &
+           det_alpha_grad_lapl_SVD_unique(2,e,l) * jast_grad_jast_inv_y(e) + &
+           det_alpha_grad_lapl_SVD_unique(3,e,l) * jast_grad_jast_inv_z(e)
+    enddo
+    h = 0.d0
+    do e = elec_alpha_num+1, elec_num
+      h += det_beta_grad_lapl_SVD_unique(1,e,lp) * jast_grad_jast_inv_x(e) + &
+           det_beta_grad_lapl_SVD_unique(2,e,lp) * jast_grad_jast_inv_y(e) + &
+           det_beta_grad_lapl_SVD_unique(3,e,lp) * jast_grad_jast_inv_z(e)
+    enddo
+    T += 2.d0 * ( g * det_beta_value_SVD_unique(lp) + h * det_alpha_value_SVD_unique(l) )
+
+    g = det_alpha_value_SVD_unique(l) * det_beta_value_SVD_unique(lp)
+    V = E_pot * g
+    ! TODO
+    !do e = 1, elec_alpha_num
+    !  V -= pseudo_non_local_SVD(e) * g
+    !  V += det_alpha_pseudo_SVD_unique(e,l) * det_beta_value_SVD_unique(lp)
+    !enddo
+    !do e = elec_alpha_num+1, elec_num
+    !  V -= pseudo_non_local_SVD(e) * g
+    !  V += det_alpha_value_SVD_unique(l) * det_beta_pseudo_SVD_unique(e,lp)
+    !enddo
+    f = -0.5d0*T + V
+    f *= psidet_inv_SVD
+
+    hij_fm(i) = f
+
+  enddo
+
+  hij_fm_min = min( hij_fm_min, minval(hij_fm) )
+  hij_fm_max = max( hij_fm_max, maxval(hij_fm) )
+
+  SOFT_TOUCH hij_fm_min hij_fm_max
+
+END_PROVIDER
+
+
+
+BEGIN_PROVIDER [ double precision, hij_sm, (size_hij_sm) ]
+
+  implicit none
+
+  BEGIN_DOC
+  ! !!!
+  ! hij  =  < psi_svd J | H | J l l' > / < psi_svd J | psi_svd J > 
+  !      =  < H (J l l')/(psi_svd J) >    ( first method: fm)
+  !      =  < E_loc (l l') / psi_svd >    ( secnd method: sm)
+  ! Dimensions : n_svd_toselect
+  END_DOC
+
+  integer :: i, l, lp
+
+  do i = 1, n_svd_toselect
+
+    l  = psi_svd_alpha_numtoselect(i,1)
+    lp = psi_svd_beta_numtoselect (i,1)
+
+    hij_sm(i) = E_loc * det_alpha_value_SVD_unique(l) * det_beta_value_SVD_unique(lp) * psidet_inv_SVD
+
+  enddo
+
+  hij_sm_min = min( hij_sm_min, minval(hij_sm) )
+  hij_sm_max = max( hij_sm_max, maxval(hij_sm) )
+
+  SOFT_TOUCH hij_sm_min hij_sm_max
+
+END_PROVIDER
+
+
+
+
+
+BEGIN_PROVIDER [ double precision, xij_diag, (size_xij_diag) ]
+
+  implicit none
+
+  BEGIN_DOC
+  ! !!!
+  ! < l l' | H | l l' >
+  ! Dimensions : n_svd_toselect
+  END_DOC
+
+  integer          :: i, l, lp, e
+  double precision :: f, g, h, T, V
+
+  do i = 1, n_svd_toselect
+  
+    l  = psi_svd_alpha_numtoselect(i,1)
+    lp = psi_svd_beta_numtoselect (i,1)
+  
+    ! Lapl D 
+    g = 0.d0
+    do e = 1, elec_alpha_num
+      g += det_alpha_grad_lapl_SVD_unique(4,e,l) * det_beta_value_SVD_unique(lp)
+    enddo
+    do e = elec_alpha_num+1, elec_num
+      g += det_alpha_value_SVD_unique(l) * det_beta_grad_lapl_SVD_unique(4,e,lp)
+    enddo
+    T = g
+
+    ! D (Lapl J)/J
+    g = 0.d0
+    do e = 1, elec_num
+      g += jast_lapl_jast_inv(e)
+    enddo
+    T += det_alpha_value_SVD_unique(l) * det_beta_value_SVD_unique(lp) * g
+
+    ! 2 (grad D).(Grad J)/J
+    g = 0.d0
+    do e = 1, elec_alpha_num
+      g += det_alpha_grad_lapl_SVD_unique(1,e,l) * jast_grad_jast_inv_x(e) + &
+           det_alpha_grad_lapl_SVD_unique(2,e,l) * jast_grad_jast_inv_y(e) + &
+           det_alpha_grad_lapl_SVD_unique(3,e,l) * jast_grad_jast_inv_z(e)
+    enddo
+    h = 0.d0
+    do e = elec_alpha_num+1, elec_num
+      h += det_beta_grad_lapl_SVD_unique(1,e,lp) * jast_grad_jast_inv_x(e) + &
+           det_beta_grad_lapl_SVD_unique(2,e,lp) * jast_grad_jast_inv_y(e) + &
+           det_beta_grad_lapl_SVD_unique(3,e,lp) * jast_grad_jast_inv_z(e)
+    enddo
+    T += 2.d0 * ( g * det_beta_value_SVD_unique(lp) + h * det_alpha_value_SVD_unique(l) )
+
+    g = det_alpha_value_SVD_unique(l) * det_beta_value_SVD_unique(lp)
+    V = E_pot * g
+    ! TODO
+    !do e = 1, elec_alpha_num
+    !  V -= pseudo_non_local_SVD(e) * g
+    !  V += det_alpha_pseudo_SVD_unique(e,l) * det_beta_value_SVD_unique(lp)
+    !enddo
+    !do e = elec_alpha_num+1, elec_num
+    !  V -= pseudo_non_local_SVD(e) * g
+    !  V += det_alpha_value_SVD_unique(l) * det_beta_pseudo_SVD_unique(e,lp)
+    !enddo
+    f = -0.5d0*T + V
+    f *= psidet_inv_SVD * psidet_inv_SVD
+
+    xij_diag(i) = f * det_alpha_value_SVD_unique(l) * det_beta_value_SVD_unique(lp)
+
+  enddo
+
+  xij_diag_min = min( xij_diag_min, minval(xij_diag) )
+  xij_diag_max = max( xij_diag_max, maxval(xij_diag) )
+
+  SOFT_TOUCH xij_diag_min xij_diag_max
+
+END_PROVIDER
+
+
+
+
+BEGIN_PROVIDER [ double precision, overlop_selected_matrix, (size_overlop_selected_matrix) ]
+  implicit none
+  BEGIN_DOC
+  ! !!!
+  ! < k_selected k'_selected | l_selected l'_selected >
+  ! Dimensions : n_svd_selected * n_svd_selected
+  END_DOC
+
+  integer          :: k, kp, l, lp
+  integer          :: i, j, ii0, ii
+  double precision :: f
+
+  do i = 1, n_svd_selected
+    ii0 = (i-1)*n_svd_selected
+
+    l  = psi_svd_alpha_numselected(i,1)
+    lp = psi_svd_beta_numselected (i,1)
+
+    f = det_alpha_value_SVD_unique(l) * det_beta_value_SVD_unique(lp) * psidet_inv_SVD * psidet_inv_SVD
+
+    do j = 1, n_svd_selected
+      ii = ii0 + j
+
+      k  = psi_svd_alpha_numselected(j,1)
+      kp = psi_svd_beta_numselected (j,1)
+
+      overlop_selected_matrix(ii) = det_alpha_value_SVD_unique(k) * det_beta_value_SVD_unique(kp) * f
+
+    enddo
+  enddo
+
+  overlop_selected_matrix_min = min(overlop_selected_matrix_min,minval(overlop_selected_matrix))
+  overlop_selected_matrix_max = max(overlop_selected_matrix_max,maxval(overlop_selected_matrix))
+  SOFT_TOUCH overlop_selected_matrix_min overlop_selected_matrix_max
+END_PROVIDER
+
+
+
+BEGIN_PROVIDER [ double precision, h_selected_matrix, (size_h_selected_matrix) ]
+  implicit none
+  BEGIN_DOC
+  ! !!!
+  ! < k_selected k'_selected | H | l_selected l'_selected >
+  ! Dimensions : n_svd_selected * n_svd_selected
+  END_DOC
+
+  integer          :: k, kp, l, lp
+  integer          :: i, j, ii0, ii
+  integer          :: e
+  double precision :: f, g, h, T, V
+
+  do i = 1, n_svd_selected
+    ii0 = (i-1)*n_svd_selected
+
+    l  = psi_svd_alpha_numselected(i,1)
+    lp = psi_svd_beta_numselected (i,1)
+
+    ! Lapl D 
+    g = 0.d0
+    do e = 1, elec_alpha_num
+      g += det_alpha_grad_lapl_SVD_unique(4,e,l) * det_beta_value_SVD_unique(lp)
+    enddo
+    do e = elec_alpha_num+1, elec_num
+      g += det_alpha_value_SVD_unique(l) * det_beta_grad_lapl_SVD_unique(4,e,lp)
+    enddo
+    T = g
+
+    ! D (Lapl J)/J
+    g = 0.d0
+    do e = 1, elec_num
+      g += jast_lapl_jast_inv(e)
+    enddo
+    T += det_alpha_value_SVD_unique(l) * det_beta_value_SVD_unique(lp) * g
+
+    ! 2 (grad D).(Grad J)/J
+    g = 0.d0
+    do e = 1, elec_alpha_num
+      g += det_alpha_grad_lapl_SVD_unique(1,e,l) * jast_grad_jast_inv_x(e) + &
+           det_alpha_grad_lapl_SVD_unique(2,e,l) * jast_grad_jast_inv_y(e) + &
+           det_alpha_grad_lapl_SVD_unique(3,e,l) * jast_grad_jast_inv_z(e)
+    enddo
+    h = 0.d0
+    do e = elec_alpha_num+1, elec_num
+      h += det_beta_grad_lapl_SVD_unique(1,e,lp) * jast_grad_jast_inv_x(e) + &
+           det_beta_grad_lapl_SVD_unique(2,e,lp) * jast_grad_jast_inv_y(e) + &
+           det_beta_grad_lapl_SVD_unique(3,e,lp) * jast_grad_jast_inv_z(e)
+    enddo
+    T += 2.d0 * ( g * det_beta_value_SVD_unique(lp) + h * det_alpha_value_SVD_unique(l) )
+
+    g = det_alpha_value_SVD_unique(l) * det_beta_value_SVD_unique(lp)
+    V = E_pot * g
+    ! TODO
+    ! ajouter le terme pseudo
+    !do e = 1, elec_alpha_num
+    !  V -= pseudo_non_local_SVD(e) * g
+    !  V += det_alpha_pseudo_SVD_unique(e,l) * det_beta_value_SVD_unique(lp)
+    !enddo
+    !do e = elec_alpha_num+1, elec_num
+    !  V -= pseudo_non_local_SVD(e) * g
+    !  V += det_alpha_value_SVD_unique(l) * det_beta_pseudo_SVD_unique(e,lp)
+    !enddo
+    f = -0.5d0*T + V
+    f *= psidet_inv_SVD * psidet_inv_SVD
+
+    do j = 1, n_svd_selected
+      ii = ii0 + j
+
+      k  = psi_svd_alpha_numselected(j,1)
+      kp = psi_svd_beta_numselected (j,1)
+
+      h_selected_matrix(ii) = f * det_alpha_value_SVD_unique(k) * det_beta_value_SVD_unique(kp)
+
+    enddo
+  enddo
+
+  h_selected_matrix_min = min(h_selected_matrix_min,minval(h_selected_matrix))
+  h_selected_matrix_max = max(h_selected_matrix_max,maxval(h_selected_matrix))
+  SOFT_TOUCH h_selected_matrix_min h_selected_matrix_max
+END_PROVIDER
+
--- a/src/PROPERTIES/properties_energy.irp.f
+++ b/src/PROPERTIES/properties_energy.irp.f
@ -252,12 +252,10 @@ BEGIN_PROVIDER  [ double precision, E_loc ]
  enddo

  ! Avoid divergence of E_loc and population explosion
-  if (do_pseudo) then
+  if (do_pseudo .and. (qmc_method == t_DMC) ) then
    double precision :: delta_e
-!    delta_e = E_loc-E_ref
-!    E_loc = E_ref + erf(delta_e*time_step_sq)/time_step_sq
-     E_loc = max(2.d0*E_ref, E_loc)
-!    continue
+    delta_e = E_loc-E_ref
+    E_loc = E_ref + delta_e * dexp(-dabs(delta_e)*time_step_sq)
  endif
  E_loc_min = min(E_loc,E_loc_min)
  E_loc_max = max(E_loc,E_loc_max)
--- a/src/det.irp.f
+++ b/src/det.irp.f
--- a/src/mo.irp.f
+++ b/src/mo.irp.f
@ -5,12 +5,12 @@
 ! Number of Molecular orbitals
  END_DOC
  integer, external              :: mod_align
-  
+
  mo_num = maxval(present_mos)
  call iinfo(irp_here,'mo_num',mo_num)
-  
+
  mo_num_8 = mod_align(mo_num)
-  
+
 END_PROVIDER


@ -22,7 +22,7 @@ BEGIN_PROVIDER [ real, mo_coef_input, (ao_num_8,mo_tot_num) ]
  integer                        :: i, j
  real,allocatable               :: buffer(:,:)
  allocate (buffer(ao_num,mo_tot_num))
-  
+
  buffer = 0.
  call get_mo_basis_mo_coef(buffer)
  do i=1,mo_tot_num
@ -35,7 +35,7 @@ BEGIN_PROVIDER [ real, mo_coef_input, (ao_num_8,mo_tot_num) ]
    call set_order(mo_coef_input(1,i),ao_nucl_sort_idx,ao_num)
  enddo
  deallocate(buffer)
-  
+
 END_PROVIDER


@ -56,7 +56,7 @@ BEGIN_PROVIDER [ real, mo_coef, (ao_num_8,mo_num_8) ]
 ! Molecular orbital coefficients
  END_DOC
  integer                        :: i, j
-  
+
  do j=1,mo_num
    do i=1,ao_num_8
      mo_coef(i,j) = mo_coef_input(i,j)
@ -68,10 +68,10 @@ BEGIN_PROVIDER [ real, mo_coef, (ao_num_8,mo_num_8) ]
      mo_coef(i,j) = 0.
    enddo
  enddo
-  
+
  ! Input MOs are not needed any more
  FREE mo_coef_input
-  
+
  real                           :: f
  f = 1./mo_scale
  do j=1,mo_num
@ -80,7 +80,7 @@ BEGIN_PROVIDER [ real, mo_coef, (ao_num_8,mo_num_8) ]
      mo_coef(i,j) *= f
    enddo
  enddo
-  
+
 END_PROVIDER


@ -90,7 +90,7 @@ BEGIN_PROVIDER [ real, mo_coef_transp, (mo_num_8,ao_num_8) ]
 ! Transpose of the Molecular orbital coefficients
  END_DOC
  call transpose(mo_coef,ao_num_8,mo_coef_transp,mo_num_8,ao_num_8,mo_num_8)
-  
+
 END_PROVIDER


@ -102,7 +102,7 @@ END_PROVIDER
 ! orbital coefficients
  END_DOC
  integer                        :: i, j
-  
+
  integer                        :: idx
  mo_coef_transp_sparsity = 0.
  do j=1,ao_num
@ -117,7 +117,7 @@ END_PROVIDER
    mo_coef_transp_sparsity += float(idx)
  enddo
  mo_coef_transp_sparsity *= 1./(mo_num*ao_num)
-  
+
 END_PROVIDER


@ -133,7 +133,7 @@ BEGIN_PROVIDER [ real, mo_coef_transp_present, (num_present_mos_8,ao_num_8) ]
      mo_coef_transp_present(j,i) = mo_coef_transp(present_mos(j),i)
    enddo
  enddo
-  
+
 END_PROVIDER


@ -143,24 +143,24 @@ END_PROVIDER
 &BEGIN_PROVIDER [ real, mo_grad_transp_z, (mo_num_8,elec_num) ]
 &BEGIN_PROVIDER [ real, mo_lapl_transp, (mo_num_8,elec_num) ]
  implicit none
-  
+
  BEGIN_DOC
 ! Values, gradients, laplacians of the molecular orbitals
 !
 ! Arrays are padded for efficiency
  END_DOC
-  
+
  integer                        :: i, j, k, l, m
-  
+
  PROVIDE primitives_reduced
-  
+
  if (do_nucl_fitcusp) then
    PROVIDE nucl_fitcusp_param
    PROVIDE nucl_elec_dist_vec
    PROVIDE nucl_elec_dist_inv
  endif
-  
-  
+
+
  do i=1,elec_num
    if (i>1) then
      ao_elec = i
@ -180,7 +180,7 @@ END_PROVIDER
          mo_grad_transp_z(1,i),                                     &
          mo_lapl_transp(1,i),                                       &
          ao_num)
-      
+
    else
      call sparse_full_mv(mo_coef_transp_present,num_present_mos_8,  &
          ao_value_block(1),ao_num_8,                                &
@ -195,7 +195,7 @@ END_PROVIDER
          mo_grad_transp_z(1,i),                                     &
          mo_lapl_transp(1,i),                                       &
          ao_num)
-      
+
      do j=num_present_mos,1,-1
        mo_value_transp (present_mos(j),i) = mo_value_transp (j,i)
        mo_grad_transp_x(present_mos(j),i) = mo_grad_transp_x(j,i)
@ -207,10 +207,10 @@ END_PROVIDER
        endif
      enddo
    endif
-    
+
    if (do_nucl_fitcusp) then
      real                           :: r, r2, r_inv, d, expzr, Z, Z2, a, b, c, phi, rx, ry, rz
-      
+
      do k=1,nucl_num
        r = nucl_elec_dist(k,i)
        if (r > nucl_fitcusp_radius(k)) then
@ -235,14 +235,14 @@ END_PROVIDER
        enddo
        exit
      enddo ! k
-      
+
    endif
-    
+
  enddo  ! i
  ao_elec = 1
  SOFT_TOUCH ao_elec
-  
-  
+
+
  if (do_prepare) then
    real                           :: lambda, t
    ! Scale off-diagonal elements
@ -268,7 +268,7 @@ END_PROVIDER
      enddo
    enddo
  endif
-  
+
  do i=1,mo_num
    do j=1,elec_num
        mo_value_transp(i,j)  *= mo_cusp_rescale(i)
@ -285,10 +285,10 @@ BEGIN_PROVIDER [ real, mo_value, (elec_num_8,mo_num) ]
  BEGIN_DOC
 ! Values of the molecular orbitals
  END_DOC
-  
+
  integer                        :: i,j
  integer, save                  :: ifirst = 0
-  
+
  if (ifirst == 0) then
    ifirst = 1
    PROVIDE primitives_reduced
@ -296,7 +296,7 @@ BEGIN_PROVIDER [ real, mo_value, (elec_num_8,mo_num) ]
    mo_value = 0.
  endif
  call transpose(mo_value_transp(1,1),mo_num_8,mo_value,elec_num_8,mo_num,elec_num)
-  
+
 END_PROVIDER


@ -304,14 +304,14 @@ END_PROVIDER
 &BEGIN_PROVIDER [ double precision, mo_grad_y, (elec_num_8,mo_num) ]
 &BEGIN_PROVIDER [ double precision, mo_grad_z, (elec_num_8,mo_num) ]
  implicit none
-  
+
  BEGIN_DOC
 ! Gradients of the molecular orbitals
  END_DOC
-  
+
  integer                        :: i,j
  integer, save                  :: ifirst = 0
-  
+
  if (ifirst == 0) then
    !DIR$ VECTOR ALIGNED
    mo_grad_x = 0.d0
@ -327,7 +327,7 @@ END_PROVIDER
  call transpose_to_dp(mo_grad_transp_z(1,1),mo_num_8,mo_grad_z(1,1),elec_num_8,mo_num,elec_num)
  call transpose_to_dp(mo_grad_transp_x(1,1),mo_num_8,mo_grad_x(1,1),elec_num_8,mo_num,elec_num)

-  
+
 END_PROVIDER

 BEGIN_PROVIDER [ double precision, mo_lapl, (elec_num_8,mo_num) ]
@ -335,7 +335,7 @@ BEGIN_PROVIDER [ double precision, mo_lapl, (elec_num_8,mo_num) ]
  BEGIN_DOC
 ! Laplacians of the molecular orbitals
  END_DOC
-  
+
  integer                        :: i,j
  integer, save                  :: ifirst = 0
  if (ifirst == 0) then
@ -345,7 +345,7 @@ BEGIN_PROVIDER [ double precision, mo_lapl, (elec_num_8,mo_num) ]
    mo_lapl = 0.d0
  endif
  call transpose_to_dp(mo_lapl_transp(1,1),mo_num_8,mo_lapl,elec_num_8,mo_num,elec_num)
-  
+
 END_PROVIDER


@ -358,21 +358,21 @@ END_PROVIDER
 integer :: i,j
 do j=1,mo_num
    do i=1,elec_alpha_num
-      mo_grad_lapl_alpha(1,i,j) = mo_grad_transp_x(j,i) 
-      mo_grad_lapl_alpha(2,i,j) = mo_grad_transp_y(j,i) 
-      mo_grad_lapl_alpha(3,i,j) = mo_grad_transp_z(j,i) 
-      mo_grad_lapl_alpha(4,i,j) = mo_lapl_transp  (j,i) 
+      mo_grad_lapl_alpha(1,i,j) = mo_grad_transp_x(j,i)
+      mo_grad_lapl_alpha(2,i,j) = mo_grad_transp_y(j,i)
+      mo_grad_lapl_alpha(3,i,j) = mo_grad_transp_z(j,i)
+      mo_grad_lapl_alpha(4,i,j) = mo_lapl_transp  (j,i)
    enddo
  enddo
  do j=1,mo_num
    do i=elec_alpha_num+1,elec_num
-      mo_grad_lapl_beta(1,i,j) = mo_grad_transp_x(j,i) 
-      mo_grad_lapl_beta(2,i,j) = mo_grad_transp_y(j,i) 
-      mo_grad_lapl_beta(3,i,j) = mo_grad_transp_z(j,i) 
-      mo_grad_lapl_beta(4,i,j) = mo_lapl_transp  (j,i) 
+      mo_grad_lapl_beta(1,i,j) = mo_grad_transp_x(j,i)
+      mo_grad_lapl_beta(2,i,j) = mo_grad_transp_y(j,i)
+      mo_grad_lapl_beta(3,i,j) = mo_grad_transp_z(j,i)
+      mo_grad_lapl_beta(4,i,j) = mo_lapl_transp  (j,i)
  enddo
 enddo
- 
+
 END_PROVIDER

 BEGIN_PROVIDER [ double precision, mo_grad_lapl_transp, (4,mo_num,elec_num) ]
@ -389,7 +389,7 @@ BEGIN_PROVIDER [ double precision, mo_grad_lapl_transp, (4,mo_num,elec_num) ]
     mo_grad_lapl_transp(4,j,i) = mo_lapl_transp  (j,i)
   enddo
 enddo
- 
+
 END_PROVIDER


@ -404,18 +404,18 @@ END_PROVIDER


 BEGIN_PROVIDER [ integer, mo_tot_num ]
-  
+
  BEGIN_DOC
 ! Total number of MOs in the EZFIO file
  END_DOC
-  
+
  mo_tot_num = -1
  call get_mo_basis_mo_num(mo_tot_num)
  if (mo_tot_num <= 0) then
    call abrt(irp_here,'Total number of MOs can''t be <0')
  endif
  call iinfo(irp_here,'mo_tot_num',mo_tot_num)
-  
+
 END_PROVIDER


@ -432,16 +432,16 @@ BEGIN_PROVIDER [ double precision , mo_value_at_nucl, (mo_num_8,nucl_num) ]
  END_DOC
  integer                        :: i, j, k, l
  real                           :: ao_value_at_nucl_no_S(ao_num)
-  
+
  PROVIDE mo_fitcusp_normalization_before
  do k=1,nucl_num
    point(1) = nucl_coord(k,1)
    point(2) = nucl_coord(k,2)
    point(3) = nucl_coord(k,3)
    TOUCH point
-    
+
    PROVIDE ao_value_p
-    
+
    do i=1,ao_num
      if (ao_nucl(i) /= k) then
        ao_value_at_nucl_no_S(i) = ao_value_p(i)
@ -449,7 +449,7 @@ BEGIN_PROVIDER [ double precision , mo_value_at_nucl, (mo_num_8,nucl_num) ]
        ao_value_at_nucl_no_S(i) = 0.
      endif
    enddo
-    
+
    integer :: jj
    do jj=1,num_present_mos
      j = present_mos(jj)
@ -459,11 +459,11 @@ BEGIN_PROVIDER [ double precision , mo_value_at_nucl, (mo_num_8,nucl_num) ]
        mo_value_at_nucl(j,k) = mo_value_at_nucl(j,k) + mo_coef(i,j)*ao_value_at_nucl_no_S(i)
      enddo
    enddo
-    
+
  enddo
  FREE ao_value_p ao_grad_p ao_lapl_p ao_axis_grad_p ao_oned_grad_p ao_oned_prim_grad_p ao_oned_lapl_p ao_axis_lapl_p ao_oned_prim_lapl_p ao_oned_p ao_oned_prim_p ao_axis_p ao_axis_power_p
  SOFT_TOUCH point
-  
+
 END_PROVIDER


@ -474,15 +474,15 @@ END_PROVIDER
  BEGIN_DOC
 ! Values of the atomic orbitals without S components on atoms
  END_DOC
-  
+
  integer                        :: i, j, k
-  
+
  do k=1,nucl_num
    point(1) = nucl_coord(k,1)
    point(2) = nucl_coord(k,2)
    point(3) = nucl_coord(k,3)+ nucl_fitcusp_radius(k)
    TOUCH point
-    
+
    do j=1,ao_num
      ao_value_at_fitcusp_radius(j,k) = ao_value_p(j)
      ao_grad_at_fitcusp_radius(j,k) = ao_grad_p(j,3)
@ -496,7 +496,7 @@ END_PROVIDER
  enddo
  FREE ao_value_p ao_grad_p ao_lapl_p ao_axis_grad_p ao_oned_grad_p ao_oned_prim_grad_p ao_oned_lapl_p ao_axis_lapl_p ao_oned_prim_lapl_p ao_oned_p ao_oned_prim_p ao_axis_p ao_axis_power_p
  SOFT_TOUCH point
-  
+
 END_PROVIDER

 BEGIN_PROVIDER [ double precision, mo_fitcusp_normalization_before, (mo_tot_num) ]
@ -560,7 +560,7 @@ BEGIN_PROVIDER [ double precision, mo_fitcusp_normalization_after, (mo_tot_num)
          t = 0.d0
          do j=1,ao_num
            if ( (ao_nucl(j) /= k).or.(ao_power(j,4) > 0) ) then
-              t = t + mo_coef(j,i) * ao_value_p(j) 
+              t = t + mo_coef(j,i) * ao_value_p(j)
            endif
          enddo
          t = t + nucl_fitcusp_param(1,i,k) +                        &
@ -601,7 +601,7 @@ END_PROVIDER
 ! Values of the molecular orbitals without S components on atoms
  END_DOC
  integer                        :: i, j, k, l
-  
+
  do k=1,nucl_num
    do j=1,mo_num
      mo_value_at_fitcusp_radius(j,k) = 0.d0
@ -615,7 +615,7 @@ END_PROVIDER
      enddo
    enddo
  enddo
-  
+
 END_PROVIDER


@ -626,7 +626,7 @@ BEGIN_PROVIDER [ real, nucl_fitcusp_param, (4,mo_num,nucl_num) ]
  END_DOC
  integer                        :: i,k, niter
  character*(80)                 :: message
-  
+
  nucl_fitcusp_param = 0.d0
  do k=1,nucl_num
    double precision               :: r, Z
@ -642,14 +642,14 @@ BEGIN_PROVIDER [ real, nucl_fitcusp_param, (4,mo_num,nucl_num) ]
      grad_phi = mo_grad_at_fitcusp_radius(i,k)
      phi = mo_value_at_fitcusp_radius(i,k)
      eta = mo_value_at_nucl(i,k)
-      
+
      nucl_fitcusp_param(1,i,k) = -(R*(2.d0*eta*Z-6.d0*grad_phi)+lap_phi*R*R+6.d0*phi)/(2.d0*R*Z-6.d0)
      nucl_fitcusp_param(2,i,k) = (lap_phi*R*R*Z-6.d0*grad_phi*R*Z+6.d0*phi*Z+6.d0*eta*Z)/(2.d0*R*Z-6.d0)
      nucl_fitcusp_param(3,i,k) = -(R*(-5.d0*grad_phi*Z-1.5d0*lap_phi)+lap_phi*R*R*Z+3.d0*phi*Z+&
          3.d0*eta*Z+6.d0*grad_phi)/(R*R*Z-3.d0*R)
      nucl_fitcusp_param(4,i,k) = (R*(-2.d0*grad_phi*Z-lap_phi)+0.5d0*lap_phi*R*R*Z+phi*Z+&
          eta*Z+3.d0*grad_phi)/(R*R*R*Z-3.d0*R*R)
-      
+
    enddo
  enddo
 END_PROVIDER
@ -689,7 +689,7 @@ subroutine sparse_full_mv(A,LDA,                                     &
  !DIR$ ASSUME_ALIGNED C3 : $IRP_ALIGN
  !DIR$ ASSUME_ALIGNED C4 : $IRP_ALIGN
  !DIR$ ASSUME_ALIGNED C5 : $IRP_ALIGN
-  
+
  integer                        :: kao, kmax, kmax2, kmax3
  integer                        :: i,j,k
  integer                        :: k_vec(8)
@ -698,9 +698,9 @@ subroutine sparse_full_mv(A,LDA,                                     &
  real                           :: d21, d22, d23, d24, d25
  real                           :: d31, d32, d33, d34, d35
  real                           :: d41, d42, d43, d44, d45
-  
+
  ! LDC and LDA have to be factors of simd_sp
-  
+
 !  IRP_IF NO_PREFETCH
 !  IRP_ELSE
 !    call MM_PREFETCH (A(1,indices(1)),3)
@ -709,7 +709,7 @@ subroutine sparse_full_mv(A,LDA,                                     &
 !    call MM_PREFETCH (A(1,indices(4)),3)
 !  IRP_ENDIF

-  !DIR$ SIMD
+  !OMP$ SIMD
  do j=1,LDC
    C1(j) = 0.
    C2(j) = 0.
@ -727,35 +727,35 @@ subroutine sparse_full_mv(A,LDA,                                     &
    k_vec(2) = indices(kao+1)
    k_vec(3) = indices(kao+2)
    k_vec(4) = indices(kao+3)
-    
+
    d11 = B1(kao  )
    d21 = B1(kao+1)
    d31 = B1(kao+2)
    d41 = B1(kao+3)
-    
+
    d12 = B2(kao  )
    d22 = B2(kao+1)
    d32 = B2(kao+2)
    d42 = B2(kao+3)
-    
+
    d13 = B3(kao  )
    d23 = B3(kao+1)
    d33 = B3(kao+2)
    d43 = B3(kao+3)
-    
+
    d14 = B4(kao  )
    d24 = B4(kao+1)
    d34 = B4(kao+2)
    d44 = B4(kao+3)
-    
+
    d15 = B5(kao  )
    d25 = B5(kao+1)
    d35 = B5(kao+2)
    d45 = B5(kao+3)
-    
+
    do k=0,LDA-1,$IRP_ALIGN/4
      !DIR$ VECTOR ALIGNED
-      !DIR$ SIMD FIRSTPRIVATE(d11,d21,d31,d41)
+      !OMP$ SIMD FIRSTPRIVATE(d11,d21,d31,d41)
      do j=1,$IRP_ALIGN/4
 !        IRP_IF NO_PREFETCH
 !        IRP_ELSE
@ -767,18 +767,18 @@ subroutine sparse_full_mv(A,LDA,                                     &
        C1(j+k) = C1(j+k) + A(j+k,k_vec(1))*d11 + A(j+k,k_vec(2))*d21&
            +   A(j+k,k_vec(3))*d31 + A(j+k,k_vec(4))*d41
      enddo
-    
+
      !DIR$ VECTOR ALIGNED
-      !DIR$ SIMD FIRSTPRIVATE(d12,d22,d32,d42,d13,d23,d33,d43)
+      !OMP$ SIMD FIRSTPRIVATE(d12,d22,d32,d42,d13,d23,d33,d43)
      do j=1,$IRP_ALIGN/4
        C2(j+k) = C2(j+k) + A(j+k,k_vec(1))*d12 + A(j+k,k_vec(2))*d22&
            +   A(j+k,k_vec(3))*d32 + A(j+k,k_vec(4))*d42
        C3(j+k) = C3(j+k) + A(j+k,k_vec(1))*d13 + A(j+k,k_vec(2))*d23&
            +   A(j+k,k_vec(3))*d33 + A(j+k,k_vec(4))*d43
      enddo
-    
+
      !DIR$ VECTOR ALIGNED
-      !DIR$ SIMD FIRSTPRIVATE(d14,d24,d34,d44,d15,d25,d35,d45)
+      !OMP$ SIMD FIRSTPRIVATE(d14,d24,d34,d44,d15,d25,d35,d45)
      do j=1,$IRP_ALIGN/4
        C4(j+k) = C4(j+k) + A(j+k,k_vec(1))*d14 + A(j+k,k_vec(2))*d24&
            +   A(j+k,k_vec(3))*d34 + A(j+k,k_vec(4))*d44
@ -786,9 +786,9 @@ subroutine sparse_full_mv(A,LDA,                                     &
            +   A(j+k,k_vec(3))*d35 + A(j+k,k_vec(4))*d45
      enddo
    enddo
-    
+
  enddo
-  
+
  do kao = kmax2+1, kmax3
    k_vec(1) = indices(kao)
    d11 = B1(kao)
@ -799,7 +799,7 @@ subroutine sparse_full_mv(A,LDA,                                     &
    !DIR$ VECTOR ALIGNED
    do k=0,LDA-1,$IRP_ALIGN/4
      !DIR$ VECTOR ALIGNED
-      !DIR$ SIMD FIRSTPRIVATE(d11,d12,d13,d14,d15)
+      !OMP$ SIMD FIRSTPRIVATE(d11,d12,d13,d14,d15)
      do j=1,$IRP_ALIGN/4
        C1(j+k) = C1(j+k) + A(j+k,k_vec(1))*d11
        C2(j+k) = C2(j+k) + A(j+k,k_vec(1))*d12
@ -809,7 +809,7 @@ subroutine sparse_full_mv(A,LDA,                                     &
      enddo
    enddo
  enddo
-  
+
 end