sigmoid函數的數值穩定性

sigmoid函數的數值穩定性

news/2025/7/5 17:21:54/文章來源:https://wangcaiyong.blog.csdn.net/article/details/79130792

在深度學習中，我們常常選用sigmoid函數作為激活函數。sigmoid函數的具體形式如下：

f (x) = 1 1 + e ? x

$f(x)=\frac{1}{1+e^{-x}}$
曲線表示為：

再畫大一點，取x區間更大一些，則為：

這里寫圖片描述

這里寫圖片描述

顯然從圖像上看，sigmoid函數是數值穩定的，即對于更大范圍的x，y的取值是連續的，有效的。

從理論上看，

lim x \to + \infty f (x) = 1; lim x \to ? \infty f (x) = 0

${\lim}_{x\rightarrow +\infty}f(x)=1;\\ {\lim}_{x\rightarrow -\infty}f(x)=0$
且中間數值可以從數學上證明是穩定的。
但我們考慮1-f(x)呢？

1 ? f (x) = e ? x 1 + e ? x

$1- f(x)=\frac{e^{-x}}{1+e^{-x}}$
我們用matlab繪制其曲線：

這里寫圖片描述

我們發現這時，當x趨向負無窮，甚至僅僅x趨向-800，此時1-f(x)就不再穩定了，在matlab的值變成了NAN了。

其實我們發現，對于 1- f(x)，顯然當x趨向正無窮時，還是穩定的，此時：
分子： $e^{-x}\rightarrow 0$ ,而分母: $1+e^{-x} \rightarrow 1$ ,

顯然 $\frac{0}{1}$ ，結果趨向0.

但是當x趨向負無窮時，此時，
分子： $e^{-x}\rightarrow +\infty$ ,而分母: $1+e^{-x} \rightarrow +\infty$ ,
此時：
$\frac{e^{-x}}{1+e^{-x}}$ 就會變得不穩定,盡管理論上趨向1。
因此就出現了以上的圖像。

那么如何解決這種不穩定問題的解呢？

其實有兩種辦法：

（一）先計算穩定的f(x),結果賦予y,再計算1-y .

乍看從數學上，好像完全一致，但是在數值解上不等價。 y=f(x)是穩定的，因此對于1-f(x)=1-y也變成了穩定的解。

我們從圖像上證明：

這里寫圖片描述

此時就正確了，與理論解完全一致。

（二）直接從1-f(x)著手
這里我們從caffe的sigmoid_cross_entropy_loss_layer.cpp得到啟發。

主要辦法就是對于

1 ? f (x) = e ? x 1 + e ? x

$1- f(x)=\frac{e^{-x}}{1+e^{-x}}$
分別考慮正負x.

當 $x\geq 0$ 時，維持上式不變；
當 $x< 0$ 時，分子分母同時乘以 $e^x$ ,則有：

e ? x 1 + e ? x = ? ? ? ? ? ? ? e ? x 1 + e ? x 1 1 + e x x \geq 0 x < 0

$\frac{e^{-x}}{1+e^{-x}}=\left\{\begin{matrix} \frac{e^{-x}}{1+e^{-x}} & x\geq 0\\ \frac{1}{1+e^{x}}& x< 0 \end{matrix}\right.$

此時繪制曲線為：

這里寫圖片描述

因此在實際coding中，我們需要考慮計算的穩定性。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/258566.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/258566.shtml
英文地址，請注明出處：http://en.pswp.cn/news/258566.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

查看CentOS版本方法

查看CentOS版本方法

有以下命令可以查看： # lsb_release -a LSB Version: :core-3.1-ia32:core-3.1-noarch:graphics-3.1-ia32:graphics-3.1-noarchDistributor ID: CentOSDescription: CentOS release 5.4 (Final)Release: 5.4Codename: Final這個命令適用于所有的li…

閱讀更多...

windows遠程連接ubuntu 黑屏_Windows跟Windows遠程連接傳輸文件

windows遠程連接ubuntu 黑屏_Windows跟Windows遠程連接傳輸文件

關注奕奇科技，學習更多小妙招電腦小知識，值得收藏我們一般在使用windows遠程連接時需要傳輸文件該怎么辦？我們可以插入U盤導入導出，但這樣很是麻煩而且如果身邊暫時沒有U盤的情況就要通過社交工具傳播文件，大的文件也更…

閱讀更多...

思維導圖分析http之前端組成

思維導圖分析http之前端組成

思維導圖分析http前端組成全文總覽本文分為三個部分：前端組成，http協議，http服務器應用程序。http的應用按照我自己的理解分為前端應用以及后端應用，所以我分別寫了前端組成以及http服務器應用程序兩章，中間穿插了一章…

閱讀更多...

Linux命令工具基礎02 文件及目錄管理

Linux命令工具基礎02 文件及目錄管理

文件及目錄管理文件管理不外乎文件或目錄的創建、刪除、查詢、移動，有mkdir/rm/mv 文件查詢是重點，用find來進行查詢；find的參數豐富，也非常強大； 查看文件內容是個大的話題，文本的處理有太多的工具供我們…

閱讀更多...

caffe 關于Deconvolution的初始化注意事項

caffe 關于Deconvolution的初始化注意事項

對于fcn，經常要使用到Deconvolution進行上采樣。對于caffe使用者，使用Deconvolution上采樣，其參數往往直接給定，不需要通過學習獲得。給定參數的方式很有意思，可以通過兩種方式實現，但是這兩種方式并非完…

閱讀更多...

多目標進化優化_SDIM 學術講座|分解多目標優化與帕累托多任務學習

多目標進化優化_SDIM 學術講座|分解多目標優化與帕累托多任務學習

分解多目標優化與帕累托多任務學習2020年11月4日晚，香港城市大學電腦學系講座教授、博士生導師、IEEE Fellow張青富教授應我院王振坤教授的邀請，在線舉辦了一場主題為“分解多目標優化與帕累托多任務學習”的學術講座。此次講座采用線上和線下兩種渠道&a…

閱讀更多...

hibernate（nested transactions not supported）異常

hibernate（nested transactions not supported）異常

org.hibernate.TransactionException: nested transactions not supported錯誤的解決方法！ 原因：事務沒有提交，事務提交后正常 Transaction tx session.beginTransaction(); tx.commit(); //缺少這句話轉載于:https://www.cnblogs.com/lmq-1…

閱讀更多...

Ubuntu使用Windows下的conio.h

Ubuntu使用Windows下的conio.h

把虛線框里面的內容粘貼進文檔文本里面 ---------------------------------------------------------------------------------------------------------- #include <termios.h>#include <stdio.h>static struct termios old, new;/* Initialize new terminal i/o …

閱讀更多...

安裝oracle-java,并覆蓋原先的OpenJDK

安裝oracle-java,并覆蓋原先的OpenJDK

Centos默認安裝openJDK只安裝了java,沒有安裝javac.如果需要安裝javac，需要install the openjdk-8-jdk package。參考：http://openjdk.java.net/install/ 為了完整地安裝java，我們轉而選擇使用oracle-java，由于我們沒有root權限&a…

閱讀更多...

反射創建對象_如何應用Java反射技術靈活地創建程序類的對象實例

反射創建對象_如何應用Java反射技術靈活地創建程序類的對象實例

軟件項目實訓及課程設計指導——如何應用Java反射技術靈活地創建程序類的對象實例1、如何應用屬性配置文件實現對系統中的配置信息進行讀寫操作Java中的屬性配置文件主要可以作為軟件應用系統及項目的配置文件，比如許多J2EE的開源框架系統中都提供了屬性配置文件作為…

閱讀更多...

js回到頂部

js回到頂部

2019獨角獸企業重金招聘Python工程師標準>>> <html xmlns"http://www.w3.org/1999/xhtml"> <head runat"server"> <title></title> <style type"text/css"> #control_pannel …

閱讀更多...

java 產生的固體物的基礎上增刪改的SQL聲明

java 產生的固體物的基礎上增刪改的SQL聲明

經過多次修改。最后版本。package com.power.sql;import java.lang.reflect.Field; import java.lang.reflect.Modifier; import java.util.List; import java.util.Vector;import org.apache.commons.lang3.reflect.FieldUtils; /*** author Gary Huang* 博客地址：…

閱讀更多...

OSEK簡介

OSEK簡介

What is OSEKA specification for an RTOS?With standard software interfaces (OS API)?Including intertask & interprocessor communication (COM)?Including network management (NM)?Including the language used to statically declare OS elements used in an a…

閱讀更多...

python中布爾型的值_在python中對于bool布爾值的取反操作

python中布爾型的值_在python中對于bool布爾值的取反操作

背景根據公司業務的需求，需要做一個對于mysql數據庫的大批量更新。腳本嘛也是干干單單。使用了redis的隊列做緩存，可以異步并發的多任務進行更新。有點難受的地方在于，請求訪問時，因為一些網速，速率之內的原因&#xf…

閱讀更多...

門道多：一次MaxCompute PS任務的問題排查之旅

門道多：一次MaxCompute PS任務的問題排查之旅

關于PS是什么，可以參考一下以下兩個介紹：基于參數服務器的大規模在線學習算法和Parameter Server。更多問題可以咨詢玄樂。下面主要總結一下這回遇到一個PS任務跑不起來的問題排查過程。不想看過程的直接看最后一點總結就行。一為什么要分享一個問題排查…

閱讀更多...

源碼安裝Bazel

源碼安裝Bazel

有時候我們需要源碼安裝tensorflow，這時逃不過的第一步就是安裝Bazel,如果沒有root權限的時候，這時我們就需要源碼安裝Bazel了。下面是安裝步驟，參考：https://docs.bazel.build/versions/master/install-compile-source.html 1. E…

閱讀更多...

234. Palindrome Linked List

234. Palindrome Linked List

Given a singly linked list, determine if it is a palindrome. Follow up:Could you do it in O(n) time and O(1) space? 先找到鏈表中點，將第二部分反轉，然后比較兩部分鏈表的值。 /** * Definition for singly-linked list. * public class ListNo…

閱讀更多...

當查找名字的時候通過外圍作用域向外查找(如何理解）

當查找名字的時候通過外圍作用域向外查找(如何理解）

int a;//#1int b;//#2namespace A{int c;//#3void fun(){int a;//#4使用(a);//從里查找已經聲明名字首先尋找內層花括號之內a找#3//會繼續查找使用(b);//從里查找已經聲明名字//首先尋找內層花括號之內沒有聲明b//繼續外層花括號（namespace A）內尋找沒有…

閱讀更多...

python 服務注冊_將python程序注冊為Ubuntu系統服務，并開機啟動的方法。

python 服務注冊_將python程序注冊為Ubuntu系統服務，并開機啟動的方法。

一、系統環境操作系統：ubuntu 18 (該版本已默認使用systemd作為init)python版本：3.6二、步驟(一)準備python程序1、在 /usr/bin/ 下新建python程序 svc-test.py# nano /usr/bin/svc-test.py#! /usr/bin/python3import timewhile True:f open(/tmp/svc-t…

閱讀更多...

源碼安裝NASM，無root權限

源碼安裝NASM，無root權限

首先說明我的系統是redhat linux64位。沒有root權限。我們想安裝nasm2.13. 下面介紹具體的安裝步驟。 1. 下載源碼: https://www.nasm.us/pub/nasm/releasebuilds/2.13/ 選擇nasm-2.13-xdoc.tar.gz下載在本地目錄下 2. 解壓，tar -xvzf nasm-2.13-xdoc.tar.gz &…

閱讀更多...

最新文章