static inline void __save_init_fpu(struct task_struct *tsk)
 {
        fpu_save_init(&tsk->thread.fpu);
-       task_thread_info(tsk)->status &= ~TS_USEDFPU;
 }
 
 static inline int fpu_fxrstor_checking(struct fpu *fpu)
 {
        if (task_thread_info(tsk)->status & TS_USEDFPU) {
                __save_init_fpu(tsk);
+               task_thread_info(tsk)->status &= ~TS_USEDFPU;
                stts();
        } else
                tsk->fpu_counter = 0;
 
        WARN_ON_ONCE(!irq_fpu_usable());
        preempt_disable();
-       if (me->status & TS_USEDFPU)
+       if (me->status & TS_USEDFPU) {
                __save_init_fpu(me->task);
-       else
+               me->status &= ~TS_USEDFPU;
+               /* We do 'stts()' in kernel_fpu_end() */
+       } else
                clts();
 }
 
        WARN_ON_ONCE(!(task_thread_info(tsk)->status & TS_USEDFPU));
        preempt_disable();
        __save_init_fpu(tsk);
+       task_thread_info(tsk)->status &= ~TS_USEDFPU;
        stts();
        preempt_enable();
 }