daerduocarey / spatialtransformerlayer Goto Github PK

License: Other

C++ 36.50% Cuda 16.11% Protocol Buffer 47.39%

spatialtransformerlayer's Introduction

Implementation for Spatial Transformer Network for Caffe

This code implemented the hot-off-the-press paper Spatial Transformer Network in one of the most popular deep learning frameworks -- Caffe.

The code contains both implementation for Spatial Transformer Layer (named with st_layer) and a regularizer on the magnitude of spatial transformations (named with st_loss_layer). The latter one is useful for adjusting how aggressive would you like your spatial transformer layer to perform.

Organization of the Code

src/caffe/layers: contains the GPU implementation (.cpp and .cu file) for Spatial Transformer Layer. Notice that CPU version is not refined and it will be mush faster to use GPU version. Since I did not test on CPU version too much, it may not even correct.
src/caffe/proto: contains my proto definition for Spatial Transformer Layer (Search for 'SpatialTransformerParameter').
src/caffe/test: containts a test file for Spatial Transformer Layer.
include: contains the .hpp file for the layer.
examples: contains several sample setting files (.prototxt files) for its usages on MNIST digits and CUB bird datasets. They should be useful in understanding how to use my Spatial Transformer layer. Notice that they may not be trainable on your local machines because I have another customized layers added to my version of caffe.

Usage of Layer

My layer only support affine transformation with six parameters received from the above layer as follows.
```
  T = [	\theta_11 \theta_12 \theta_13;
  		\theta_21 \theta_22 \theta_23
  	]
```

It is not necessary that the above layer generates exactly six parameters. If it generates two (e.g. \theta\_13 and \theta\_23, this is the case for only allowing translation to happen), you can indicate other four parameters in parameters for this Spatial Transformer Layer as follows.

    layer {
      name: "st_1"
      type: "SpatialTransformer"
      bottom: "data"
      bottom: "st/theta_1"
      top: "inc1/data"
      st_param {
        to_compute_dU: false
        output_H: 224
        output_W: 224
        theta_1_1: 0.5
        theta_1_2: 0
        theta_2_1: 0
        theta_2_2: 0.5
      }
    }

In the above example, output\_H and output\_W is for indicating the output resolution, which can be differed from the resolution of input images.
It is usually the case that Spatial Transformer Layer will be applied directly on input images to the networks. If this is the case, there is no need to backpropogate the loss to image pixels. One can set to_compute_dU: false in order to disable this useless backpropogation. The default value is True.
One may find it extremely useful to refer to caffe.proto to see my definition for layer parameters of Spatial Transformer Layer.

Other Helper Layers or Utils

FileFiller can be found in ./include/caffe/file_filler.hpp. It can read initial filler values for parameters from files.
Loc_Loss_Layer can be found in ./src/caffe/layers and ./include/caffe/. It is designed by me when I experimented on CUB dataset and struggled with the problem that the transformations are so severe that the current focus is outside the region of the pixel space. If this is the case, there is no way that the focus can come back since there is no loss for it. This layer directly force parts of thetas to be small. Note that this layer works in the way that it will force any input values to be smaller than a threshold, so it will only force the parts of thetas that are computed from the bottom layer.
ST_Loss_Layer can be found in ./src/caffe/layers and ./include/caffe/. Similar to Loc_Loss_Layer, it is also designed for forcing the focus of ST layer to be inside the pixel space. The only difference is that it forces the transformed grids instead of the theta values.
Power_File_Layer can be found in ./src/caffe/layers and ./include/caffe/. It works in the similar way as Caffe Power_Layer. The only difference is that the shift values can be different for each values in the data blob. Since I only need shift functionality in my project, there is no implementation for scale and power functionalities. These two are easy to implement if one needs it.

Acknowledges

This is the job done while I had internship at Cornell in Graphics and Vision Group, advised by Prof. Kavita Bala. I would like to thank great help from Kavita and her Ph.D. students Balazs Kovacs, Kevin Matzen and Sean Bell.

Contact

Webpage: http://www.cs.stanford.edu/~kaichun/

E-mail: kaichun [at] cs.stanford.edu

spatialtransformerlayer's People

Contributors

Stargazers

Watchers

Forkers

caomw pl8787 milestonesvn shinexunju cloudherods ilovecv happynear erinchen824 leo-zhou zdltheone kli-casia tybxiaobao baiyancheng20 icarofua guoyilin edisonguo kelly-tlz aliscifp kukuruza pengyulong coderx7 dangweili odegeasslbc zhang11wu4 zhaofang0627 chuckcho tinyloop githubfragments wenhuach fanghaizhao sandbox3aster joyhuang9473 yiweichen04 absorbguo echoorchid hanulbogo lbsswu yhkim8412 litingfeng sunsunstar quziyan chunjiah dpengwen haixfeng tanxchong tangaggie zhangyislym secondpaul sunformoon mafuyan wynmew yemika dreadlord1984 zvadaszi legolas123 t2mhanh zgsxwsdxg irvingshu yousongzhu sc2830704 chengxu1995 whcjb clmtulip pinglmlcv wxbxj cosmoshua matrixplayer suzhenghang mqchen1993 wangweilai1 chunxia75qin xiaochehe rkshuai xuhui6666 corleonechensiyu yemenr hiker2046

spatialtransformerlayer's Issues

Bug (?) when normalising coordinates

Hi, @daerduoCarey

I have a question on the part of the code that deals with normalising the coordinates:
st_layer.cpp#L114-119

    Dtype* data = output_grid.mutable_cpu_data();
    for(int i=0; i<output_H_ * output_W_; ++i) {
        data[3 * i] = (i / output_W_) * 1.0 / output_H_ * 2 - 1;
        data[3 * i + 1] = (i % output_W_) * 1.0 / output_W_ * 2 - 1;
        data[3 * i + 2] = 1;
    }

If I have understood the paper correctly, the normalised coordinates should lie in [-1, 1]. In the code above, the upper bound is less than 1.

For example, for output_H_ = 2, output_W_ = 3 the result is as follows:

i: 0 [-1, -1, 1]
i: 1 [-1, -0.333333, 1]
i: 2 [-1, 0.333333, 1]
i: 3 [0, -1, 1]
i: 4 [0, -0.333333, 1]
i: 5 [0, 0.333333, 1]

So, shouldn't it be something like this instead?

    Dtype* data = output_grid.mutable_cpu_data();
    for(int i=0; i<output_H_ * output_W_; ++i) {
        data[3 * i] = (i / output_W_) * 1.0 / (output_H_ - 1) * 2 - 1;
        data[3 * i + 1] = (i % output_W_) * 1.0 / (output_W_ - 1) * 2 - 1;
        data[3 * i + 2] = 1;
    }

Which generates the following normalised coordinates:

i: 0 [-1, -1, 1]
i: 1 [-1, 0, 1]
i: 2 [-1, 1, 1]
i: 3 [1, -1, 1]
i: 4 [1, 0, 1]
i: 5 [1, 1, 1]

Thanks.

.caffemodel for initialisation

Hi,

When you trained your models, did you initialise the inception networks with imagenet-pretrained weights or did you train from scratch? I ask because in your solver.prototxt you load weights from "models/googlenet-bn-cub-st/init_googlenet_bn_cub_two_st.caffemodel". Could you share the .caffemodel that you used please?

Thank you.

How you prevent from update theta that we don't want to update

Hi, I am curious how you prevent theta from updating them. For example, If I want to fix theta_1_1 = 0.5, I write it in the .proto: theta_1_1 = 0.5 in the st_param. However, when I was reading st_layer.cpp I can't figure out how you implement this function to fix the parameter because when you do the forwarding, you just use thetas from bottom[1], but the predefined thetas are stored in pre_defined_theta. Am I wrong?

Power File layer

Hi, thank you for sharing your approaches!

I'm trying to train a model that contains your STLayer but I have some doubts about the "PowerFile" layer that I see in your examples, which adds some shift values to the input data (thetas). What is the objective of using this layer before the "LocLoss" layer?

I would also like to know which values are set in the file crop_init_1.txt (shift_file: "models/CUB_googLeNet_ST/crop_init_1.txt"), and what they represent.

Thank you very much!!

Why the results is worse than the paper's?

Hi, @daerduoCarey
Many thanks for your attention.
According to your implementation, I have got some results.
But these error percentage is two times of that paper.

The dataset generation is following the appendix A of the paper.
The rotated dataset (R) was generated from rotating MNIST training digits with a random
rotation sampled uniformly between -90 and +90 .

The network is got by your implementation.

The following is the error percentage of just rotation mnist.
model | baseline | mine
CNN | 1.2 | 3.15
FCN | 2.1 | 5.91
ST-CNN | 0.7 | 2.39
ST-FCN | 1.2 | 3.05

Can you give me some suggestion to get the approximate results?

Best Regards
Kevin

Weight initialized from the Inception pretrained on ImageNet

Hi Kaichun,

Question is for the initialization of the Inception1 and Inception2 of the 2xSTN CNN using a pretrained Inception network on ImageNet. Based on my understanding, Caffe borrows weight from the pretrained models given that the name of the layer to be trained is the same as the layer of the pretrained network (link).

In this case, how are the Inception1 and Inception2 initialized from a single pretrained Inception since the layer names to be finetuned of Inception1 and Inception2 are different?

If I haven't made my question clear, please let me know. Thank you!

What does this layer mean?

layer {
name: "st/theta_2/final"
type: "PowerFile"
bottom: "st/theta_2/pre1"
top: "st/theta_2"
power_file_param {
shift_file: "models/googlenet-bn-cub-st/crop_init_2.txt"
}
}

PowerFile error!

Hello,When I added the PowerFile layer to my caffe, I got the error:
/caffe/src/caffe/layers/power_file_layer.cpp: In instantiation of ‘void caffe::PowerFileLayer::LayerSetUp(const std::vectorcaffe::Blob&, const std::vectorcaffe::Blob&) [with Dtype = caffe::Half]’:
/caffe/src/caffe/layers/power_file_layer.cpp:85:1: required from here
/caffe/src/caffe/layers/power_file_layer.cpp:35:13: 错误：无法将左值‘std::basic_istream’绑定到‘std::basic_istream&&’
while(fin >> tmp && k < bottom[0]->count(1)) {
^
How can I solver it?

Update + whole caffe

Hi,

thanks for your implementation, it's been really useful for my recent project.
I wonder though: why do you share only the files that you modified, instead of the whole caffe?

I took me some time to insert it into up-to-date caffe master (put files where they belong, modify caffe.proto, update your files to the structural changes of Caffe), so I share the final code for those who would be interested : https://github.com/matthieudelaro/caffeBVLCplus/tree/stn. It's an up-to-date, ready to compile caffe, including STN, and un-blocked CPU implementation (which leads me to another question: why did you disable the CPU implementation?). I'll consider working on a clean PR if your willing to merge it.

cannot understand the initialization method of "output_grid" in st_layer.cpp

Hi,
I have a problem with the initialization method of output_grid, codes are as follows:

     Dtype* data = output_grid.mutable_cpu_data();
 for(int i=0; i<output_H_ * output_W_; ++i) {
 	data[3 * i] = (i / output_W_) * 1.0 / output_H_ * 2 - 1;              // x_t coordinates
 	data[3 * i + 1] = (i % output_W_) * 1.0 / output_W_ * 2 - 1;    // y_t coordinates
 	data[3 * i + 2] = 1;
 }

It seems like x_t is not normalized to [-1, 1] from [0, W], but from [0, W * H], so is y_t。
I find another initialization method(https://kevinzakka.github.io/2017/01/10/stn-part1/), which is encoded by python, and it seems to make sense:

# create normalized 2D grid
x = np.linspace(-1, 1, W)
y = np.linspace(-1, 1, H)
x_t, y_t = np.meshgrid(x, y)
# reshape to (xt, yt, 1)
ones = np.ones(np.prod(x_t.shape))
sampling_grid = np.vstack([x_t.flatten(), y_t.flatten(), ones])

Could you explain your method? Thanks a lot!

ST layer scales down input and produces wrong output during random iterations

Hi,
(1) I found that the ST layer always scales down input such that it looks like a transformed image on a black canvas.
(2) When the batch size is large (>300) the transformed output contains negative values in alternate iterations. I found this extremely bizarre.

Any help with these issues will help! I'm running on a deadline so a quick response would also be much appreciated.

dtheta update issue? transforming dtheta for getting theta?

updating dtheta gives higher than 1 in the parameters, even more than 1000? is it normal? I do not think so. Do I miss some point?

I re-implement in python
I send [dV value, U value, and dU value for every single coordinate respectively, x-y normalized coordinates] to backprop function.

@daerduoCarey your help in this regard is appreciated.

Play with the theta parameters?

Rotation-only spatial transformer networks. I want to learn a theta parameters which only rotation support. I know rotation mean [cos(theta), -sin(theta),sin(theta),cos(theta)], but how to constrain the these parameters to let the stn only support rotation.

how to use STN layer directly after imagedata layer for CUB

hi, thanks for your share. I have some confusion about how to use stn layer after our input data layer and how to get the six parameters?

How to chose the threshold for LocLoss?

Usually the [theta_1_1 theta_1_2; theta_2_1 theta_2_2] is mall (less than 1). The parameters [theta_1_3 theta_1_3] will be much bigger (because this is the offset of cropped feature map or image part). So how to set the threshold of LocLoss for those two different types of parameters? Or I misunderstand the implement? Any suggestions? @daerduoCarey

name: "GoogleNet"
layer {
name: "data"
type: "Data"
top: "data"
top: "label"
include {
phase: TRAIN
}
transform_param {
mirror: true
crop_size: 224
mean_value: 104
mean_value: 117
mean_value: 123
}
data_param {
source: "/data04/data/img_train_lmdb"
batch_size: 64
backend: LMDB
}
}
layer {
name: "data"
type: "Data"
top: "data"
top: "label"
include {
phase: TEST
}
transform_param {
mirror: false
crop_size: 224
mean_value: 104
mean_value: 117
mean_value: 123
}
data_param {
source: "/data04/data/img_test_lmdb"
batch_size: 64
backend: LMDB
}
}
#++++++++++++++++++++++++++++++++++++++++++++++++++++++
layer {
name: "loc_conv1"
type: "Convolution"
bottom: "data"
top: "loc_conv1"
convolution_param {
num_output: 20
kernel_size: 5
stride: 1
weight_filler {
type: "xavier"
}
bias_filler {
type: "constant"
}
}
}
layer {
name: "loc_pool1"
type: "Pooling"
bottom: "loc_conv1"
top: "loc_pool1"
pooling_param {
pool: MAX
kernel_size: 2
stride: 2
}
}
layer {
name: "loc_relu1"
type: "ReLU"
bottom: "loc_pool1"
top: "loc_pool1"
}
layer {
name: "loc_conv2"
type: "Convolution"
bottom: "loc_pool1"
top: "loc_conv2"
convolution_param {
num_output: 20
kernel_size: 5
stride: 1
weight_filler {
type: "xavier"
}
bias_filler {
type: "constant"
}
}
}
layer {
name: "loc_pool2"
type: "Pooling"
bottom: "loc_conv2"
top: "loc_pool2"
pooling_param {
pool: MAX
kernel_size: 2
stride: 2
}
}
layer {
name: "loc_relu2"
type: "ReLU"
bottom: "loc_pool2"
top: "loc_pool2"
}
layer {
name: "loc_ip1"
type: "InnerProduct"
bottom: "loc_pool2"
top: "loc_ip1"
inner_product_param {
num_output: 20
weight_filler {
type: "xavier"
}
bias_filler {
type: "constant"
}
}
}
layer {
name: "loc_relu3"
type: "ReLU"
bottom: "loc_ip1"
top: "loc_ip1"
}
layer {
name: "loc_reg"
type: "InnerProduct"
bottom: "loc_ip1"
top: "theta"
inner_product_param {
num_output: 6
weight_filler {
type: "constant"
value: 0
}
bias_filler {
type: "xavier"
}
}
}
layer {
name: "st_layer"
type: "SpatialTransformer"
bottom: "data"
bottom: "theta"
top: "st_output"
}
#++++++++++++++++++++++++++++++++++++++++++++++++++++++

but when i train for about 5w iteration .it turn out that :the loss and the accuracy is nearly constant:

caffe.txt

I0708 21:54:56.021843 99468 solver.cpp:330] Iteration 48000, Testing net (#0)
I0708 22:04:38.987025 99629 data_layer.cpp:73] Restarting data prefetching from start.
I0708 22:05:23.801887 99468 solver.cpp:397] Test net output #0: loss1/loss1 = 2.07656 (* 0.3 = 0.622968 loss)
I0708 22:05:23.802105 99468 solver.cpp:397] Test net output #1: loss1/top-1 = 0.367581
I0708 22:05:23.802126 99468 solver.cpp:397] Test net output #2: loss1/top-5 = 0.794675
I0708 22:05:23.802213 99468 solver.cpp:397] Test net output #3: loss2/loss2 = 2.07646 (* 0.3 = 0.622937 loss)
I0708 22:05:23.802230 99468 solver.cpp:397] Test net output #4: loss2/top-1 = 0.367581
I0708 22:05:23.802247 99468 solver.cpp:397] Test net output #5: loss2/top-5 = 0.794675
I0708 22:05:23.802261 99468 solver.cpp:397] Test net output #6: loss3/loss3 = 2.07925 (* 1 = 2.07925 loss)
I0708 22:05:23.802273 99468 solver.cpp:397] Test net output #7: loss3/top-1 = 0.367581
I0708 22:05:23.802286 99468 solver.cpp:397] Test net output #8: loss3/top-5 = 0.794675
I0708 22:05:25.693035 99468 solver.cpp:218] Iteration 48000 (0.0568391 iter/s, 703.74s/40 iters), loss = 3.72934
I0708 22:05:25.693156 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.5964 (* 0.3 = 0.77892 loss)
I0708 22:05:25.693183 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.59039 (* 0.3 = 0.777116 loss)
I0708 22:05:25.693207 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.59106 (* 1 = 2.59106 loss)
I0708 22:05:25.693228 99468 sgd_solver.cpp:105] Iteration 48000, lr = 0.001
I0708 22:06:42.168045 99468 solver.cpp:218] Iteration 48040 (0.523065 iter/s, 76.4724s/40 iters), loss = 3.688
I0708 22:06:42.168287 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.55909 (* 0.3 = 0.767729 loss)
I0708 22:06:42.168314 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.55477 (* 0.3 = 0.766431 loss)
I0708 22:06:42.168330 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.55073 (* 1 = 2.55073 loss)
I0708 22:06:42.168345 99468 sgd_solver.cpp:105] Iteration 48040, lr = 0.001
I0708 22:07:58.747380 99468 solver.cpp:218] Iteration 48080 (0.522353 iter/s, 76.5766s/40 iters), loss = 3.68185
I0708 22:07:58.747668 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.45008 (* 0.3 = 0.735024 loss)
I0708 22:07:58.747687 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.45557 (* 0.3 = 0.736671 loss)
I0708 22:07:58.747704 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.45918 (* 1 = 2.45918 loss)
I0708 22:07:58.747721 99468 sgd_solver.cpp:105] Iteration 48080, lr = 0.001
I0708 22:09:15.278134 99468 solver.cpp:218] Iteration 48120 (0.522685 iter/s, 76.5279s/40 iters), loss = 3.68409
I0708 22:09:15.278367 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.40237 (* 0.3 = 0.720711 loss)
I0708 22:09:15.278431 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.40456 (* 0.3 = 0.721368 loss)
I0708 22:09:15.278445 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.40145 (* 1 = 2.40145 loss)
I0708 22:09:15.278481 99468 sgd_solver.cpp:105] Iteration 48120, lr = 0.001
I0708 22:10:31.786173 99468 solver.cpp:218] Iteration 48160 (0.52284 iter/s, 76.5052s/40 iters), loss = 3.66804
I0708 22:10:31.786469 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.42295 (* 0.3 = 0.726885 loss)
I0708 22:10:31.786494 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.42938 (* 0.3 = 0.728814 loss)
I0708 22:10:31.786510 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.41936 (* 1 = 2.41936 loss)
I0708 22:10:31.786527 99468 sgd_solver.cpp:105] Iteration 48160, lr = 0.001
I0708 22:11:48.292574 99468 solver.cpp:218] Iteration 48200 (0.522851 iter/s, 76.5036s/40 iters), loss = 3.70242
I0708 22:11:48.292825 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.08664 (* 0.3 = 0.625991 loss)
I0708 22:11:48.292891 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.09284 (* 0.3 = 0.627853 loss)
I0708 22:11:48.292924 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.09257 (* 1 = 2.09257 loss)
I0708 22:11:48.292946 99468 sgd_solver.cpp:105] Iteration 48200, lr = 0.001
I0708 22:13:04.789505 99468 solver.cpp:218] Iteration 48240 (0.522916 iter/s, 76.4941s/40 iters), loss = 3.73753
I0708 22:13:04.789747 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.23239 (* 0.3 = 0.669717 loss)
I0708 22:13:04.789772 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.22779 (* 0.3 = 0.668337 loss)
I0708 22:13:04.789788 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.22377 (* 1 = 2.22377 loss)
I0708 22:13:04.789841 99468 sgd_solver.cpp:105] Iteration 48240, lr = 0.001
I0708 22:14:21.402251 99468 solver.cpp:218] Iteration 48280 (0.522125 iter/s, 76.61s/40 iters), loss = 3.66022
I0708 22:14:21.402489 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.02189 (* 0.3 = 0.606567 loss)
I0708 22:14:21.402513 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.03129 (* 0.3 = 0.609388 loss)
I0708 22:14:21.402529 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.02827 (* 1 = 2.02827 loss)
I0708 22:14:21.402590 99468 sgd_solver.cpp:105] Iteration 48280, lr = 0.001
I0708 22:15:37.786306 99468 solver.cpp:218] Iteration 48320 (0.523688 iter/s, 76.3813s/40 iters), loss = 3.73213
I0708 22:15:37.786543 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 1.94553 (* 0.3 = 0.583658 loss)
I0708 22:15:37.786576 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 1.94268 (* 0.3 = 0.582803 loss)
I0708 22:15:37.786592 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 1.94131 (* 1 = 1.94131 loss)
I0708 22:15:37.786607 99468 sgd_solver.cpp:105] Iteration 48320, lr = 0.001
I0708 22:16:54.439471 99468 solver.cpp:218] Iteration 48360 (0.52185 iter/s, 76.6504s/40 iters), loss = 3.73605
I0708 22:16:54.439713 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.6708 (* 0.3 = 0.801241 loss)
I0708 22:16:54.439738 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.68361 (* 0.3 = 0.805082 loss)
I0708 22:16:54.439795 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.67145 (* 1 = 2.67145 loss)
I0708 22:16:54.439812 99468 sgd_solver.cpp:105] Iteration 48360, lr = 0.001
I0708 22:18:10.929617 99468 solver.cpp:218] Iteration 48400 (0.522962 iter/s, 76.4874s/40 iters), loss = 3.72857
I0708 22:18:10.929879 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.22945 (* 0.3 = 0.668834 loss)
I0708 22:18:10.929904 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.22525 (* 0.3 = 0.667575 loss)
I0708 22:18:10.929922 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.23505 (* 1 = 2.23505 loss)
I0708 22:18:10.929936 99468 sgd_solver.cpp:105] Iteration 48400, lr = 0.001
I0708 22:19:27.477816 99468 solver.cpp:218] Iteration 48440 (0.522565 iter/s, 76.5454s/40 iters), loss = 3.74548
I0708 22:19:27.478086 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.23656 (* 0.3 = 0.670967 loss)
I0708 22:19:27.478109 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.2374 (* 0.3 = 0.671219 loss)
I0708 22:19:27.478124 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.23943 (* 1 = 2.23943 loss)
I0708 22:19:27.478139 99468 sgd_solver.cpp:105] Iteration 48440, lr = 0.001
I0708 22:20:44.099797 99468 solver.cpp:218] Iteration 48480 (0.522062 iter/s, 76.6192s/40 iters), loss = 3.66581
I0708 22:20:44.100042 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.40721 (* 0.3 = 0.722163 loss)
I0708 22:20:44.100064 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.40097 (* 0.3 = 0.72029 loss)
I0708 22:20:44.100078 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.40448 (* 1 = 2.40448 loss)
I0708 22:20:44.100098 99468 sgd_solver.cpp:105] Iteration 48480, lr = 0.001
I0708 22:22:00.522353 99468 solver.cpp:218] Iteration 48520 (0.523425 iter/s, 76.4198s/40 iters), loss = 3.76453
I0708 22:22:00.522599 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.68609 (* 0.3 = 0.805827 loss)
I0708 22:22:00.522627 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.67747 (* 0.3 = 0.803241 loss)
I0708 22:22:00.522644 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.68157 (* 1 = 2.68157 loss)
I0708 22:22:00.522661 99468 sgd_solver.cpp:105] Iteration 48520, lr = 0.001
I0708 22:23:17.130800 99468 solver.cpp:218] Iteration 48560 (0.522155 iter/s, 76.6057s/40 iters), loss = 3.69656
I0708 22:23:17.131028 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 1.98202 (* 0.3 = 0.594605 loss)
I0708 22:23:17.131055 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 1.97319 (* 0.3 = 0.591958 loss)
I0708 22:23:17.131109 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 1.96977 (* 1 = 1.96977 loss)
I0708 22:23:17.131126 99468 sgd_solver.cpp:105] Iteration 48560, lr = 0.001
I0708 22:24:33.725183 99468 solver.cpp:218] Iteration 48600 (0.52225 iter/s, 76.5916s/40 iters), loss = 3.70043
I0708 22:24:33.725426 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.20517 (* 0.3 = 0.66155 loss)
I0708 22:24:33.725450 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.21122 (* 0.3 = 0.663367 loss)
I0708 22:24:33.725467 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.21146 (* 1 = 2.21146 loss)
I0708 22:24:33.725486 99468 sgd_solver.cpp:105] Iteration 48600, lr = 0.001
I0708 22:25:50.090847 99468 solver.cpp:218] Iteration 48640 (0.523815 iter/s, 76.3629s/40 iters), loss = 3.67684
I0708 22:25:50.091091 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.3432 (* 0.3 = 0.702961 loss)
I0708 22:25:50.091152 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.34685 (* 0.3 = 0.704056 loss)
I0708 22:25:50.091166 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.34175 (* 1 = 2.34175 loss)
I0708 22:25:50.091182 99468 sgd_solver.cpp:105] Iteration 48640, lr = 0.001
I0708 22:27:06.678912 99468 solver.cpp:218] Iteration 48680 (0.522293 iter/s, 76.5853s/40 iters), loss = 3.65795
I0708 22:27:06.679167 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.22877 (* 0.3 = 0.668631 loss)
I0708 22:27:06.679220 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.21793 (* 0.3 = 0.665378 loss)
I0708 22:27:06.679235 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.22912 (* 1 = 2.22912 loss)
I0708 22:27:06.679253 99468 sgd_solver.cpp:105] Iteration 48680, lr = 0.001
I0708 22:28:23.010001 99468 solver.cpp:218] Iteration 48720 (0.524052 iter/s, 76.3283s/40 iters), loss = 3.72518
I0708 22:28:23.010248 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.09107 (* 0.3 = 0.627322 loss)
I0708 22:28:23.010272 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.08621 (* 0.3 = 0.625864 loss)
I0708 22:28:23.010321 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.0809 (* 1 = 2.0809 loss)
I0708 22:28:23.010339 99468 sgd_solver.cpp:105] Iteration 48720, lr = 0.001
I0708 22:29:39.331192 99468 solver.cpp:218] Iteration 48760 (0.52412 iter/s, 76.3184s/40 iters), loss = 3.68973
I0708 22:29:39.331473 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.2227 (* 0.3 = 0.66681 loss)
I0708 22:29:39.331499 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.24941 (* 0.3 = 0.674823 loss)
I0708 22:29:39.331519 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.24144 (* 1 = 2.24144 loss)
I0708 22:29:39.331534 99468 sgd_solver.cpp:105] Iteration 48760, lr = 0.001
I0708 22:30:55.831094 99468 solver.cpp:218] Iteration 48800 (0.522896 iter/s, 76.4971s/40 iters), loss = 3.67324
I0708 22:30:55.831348 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.21342 (* 0.3 = 0.664027 loss)
I0708 22:30:55.831378 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.21621 (* 0.3 = 0.664862 loss)
I0708 22:30:55.831395 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.21636 (* 1 = 2.21636 loss)
I0708 22:30:55.831419 99468 sgd_solver.cpp:105] Iteration 48800, lr = 0.001
I0708 22:32:12.290940 99468 solver.cpp:218] Iteration 48840 (0.523169 iter/s, 76.4571s/40 iters), loss = 3.72509
I0708 22:32:12.291190 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.02691 (* 0.3 = 0.608074 loss)
I0708 22:32:12.291224 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.01526 (* 0.3 = 0.604577 loss)
I0708 22:32:12.291283 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.0134 (* 1 = 2.0134 loss)
I0708 22:32:12.291302 99468 sgd_solver.cpp:105] Iteration 48840, lr = 0.001
I0708 22:33:28.908922 99468 solver.cpp:218] Iteration 48880 (0.52209 iter/s, 76.6152s/40 iters), loss = 3.6966
I0708 22:33:28.909173 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.07398 (* 0.3 = 0.622195 loss)
I0708 22:33:28.909195 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.06225 (* 0.3 = 0.618675 loss)
I0708 22:33:28.909211 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.08809 (* 1 = 2.08809 loss)
I0708 22:33:28.909232 99468 sgd_solver.cpp:105] Iteration 48880, lr = 0.001
I0708 22:34:45.497153 99468 solver.cpp:218] Iteration 48920 (0.522292 iter/s, 76.5855s/40 iters), loss = 3.66147
I0708 22:34:45.497378 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.10266 (* 0.3 = 0.630798 loss)
I0708 22:34:45.497402 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.12432 (* 0.3 = 0.637295 loss)
I0708 22:34:45.497417 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.10935 (* 1 = 2.10935 loss)
I0708 22:34:45.497438 99468 sgd_solver.cpp:105] Iteration 48920, lr = 0.001
I0708 22:36:01.835325 99468 solver.cpp:218] Iteration 48960 (0.524003 iter/s, 76.3354s/40 iters), loss = 3.71744
I0708 22:36:01.835561 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.2948 (* 0.3 = 0.688441 loss)
I0708 22:36:01.835587 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.27955 (* 0.3 = 0.683866 loss)
I0708 22:36:01.835603 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.27497 (* 1 = 2.27497 loss)
I0708 22:36:01.835618 99468 sgd_solver.cpp:105] Iteration 48960, lr = 0.001
I0708 22:37:18.167001 99468 solver.cpp:218] Iteration 49000 (0.524048 iter/s, 76.3289s/40 iters), loss = 3.70097
I0708 22:37:18.167237 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.43151 (* 0.3 = 0.729453 loss)
I0708 22:37:18.167266 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.43268 (* 0.3 = 0.729805 loss)
I0708 22:37:18.167320 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.43458 (* 1 = 2.43458 loss)
I0708 22:37:18.167341 99468 sgd_solver.cpp:105] Iteration 49000, lr = 0.001
I0708 22:38:34.558938 99468 solver.cpp:218] Iteration 49040 (0.523634 iter/s, 76.3892s/40 iters), loss = 3.74337
I0708 22:38:34.559170 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.30453 (* 0.3 = 0.69136 loss)
I0708 22:38:34.559198 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.3018 (* 0.3 = 0.690539 loss)
I0708 22:38:34.559252 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.30663 (* 1 = 2.30663 loss)
I0708 22:38:34.559268 99468 sgd_solver.cpp:105] Iteration 49040, lr = 0.001
I0708 22:39:50.891646 99468 solver.cpp:218] Iteration 49080 (0.524041 iter/s, 76.33s/40 iters), loss = 3.65079
I0708 22:39:50.891922 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.33304 (* 0.3 = 0.699912 loss)
I0708 22:39:50.891955 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.3247 (* 0.3 = 0.697409 loss)
I0708 22:39:50.891973 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.32369 (* 1 = 2.32369 loss)
I0708 22:39:50.891994 99468 sgd_solver.cpp:105] Iteration 49080, lr = 0.001
I0708 22:41:07.209127 99468 solver.cpp:218] Iteration 49120 (0.524146 iter/s, 76.3147s/40 iters), loss = 3.68461
I0708 22:41:07.209374 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.76688 (* 0.3 = 0.830063 loss)
I0708 22:41:07.209403 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.76896 (* 0.3 = 0.830687 loss)
I0708 22:41:07.209420 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.77983 (* 1 = 2.77983 loss)
I0708 22:41:07.209439 99468 sgd_solver.cpp:105] Iteration 49120, lr = 0.001
I0708 22:42:23.569250 99468 solver.cpp:218] Iteration 49160 (0.523853 iter/s, 76.3574s/40 iters), loss = 3.7469
I0708 22:42:23.569499 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.6264 (* 0.3 = 0.787921 loss)
I0708 22:42:23.569567 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.62424 (* 0.3 = 0.787272 loss)
I0708 22:42:23.569584 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.6222 (* 1 = 2.6222 loss)
I0708 22:42:23.569602 99468 sgd_solver.cpp:105] Iteration 49160, lr = 0.001
I0708 22:43:40.181097 99468 solver.cpp:218] Iteration 49200 (0.522131 iter/s, 76.6091s/40 iters), loss = 3.69516
I0708 22:43:40.181329 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.27227 (* 0.3 = 0.68168 loss)
I0708 22:43:40.181352 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.28629 (* 0.3 = 0.685887 loss)
I0708 22:43:40.181367 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.2701 (* 1 = 2.2701 loss)
I0708 22:43:40.181385 99468 sgd_solver.cpp:105] Iteration 49200, lr = 0.001
I0708 22:44:56.842627 99468 solver.cpp:218] Iteration 49240 (0.521793 iter/s, 76.6588s/40 iters), loss = 3.71517
I0708 22:44:56.842871 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.30889 (* 0.3 = 0.692667 loss)
I0708 22:44:56.842898 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.30581 (* 0.3 = 0.691742 loss)
I0708 22:44:56.842916 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.29975 (* 1 = 2.29975 loss)
I0708 22:44:56.842932 99468 sgd_solver.cpp:105] Iteration 49240, lr = 0.001
I0708 22:46:13.454780 99468 solver.cpp:218] Iteration 49280 (0.522129 iter/s, 76.6094s/40 iters), loss = 3.70305
I0708 22:46:13.455013 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.4077 (* 0.3 = 0.722311 loss)
I0708 22:46:13.455044 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.42333 (* 0.3 = 0.726998 loss)
I0708 22:46:13.455063 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.42115 (* 1 = 2.42115 loss)
I0708 22:46:13.455080 99468 sgd_solver.cpp:105] Iteration 49280, lr = 0.001
I0708 22:47:30.085047 99468 solver.cpp:218] Iteration 49320 (0.522006 iter/s, 76.6275s/40 iters), loss = 3.67179
I0708 22:47:30.085289 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.44605 (* 0.3 = 0.733816 loss)
I0708 22:47:30.085316 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.43759 (* 0.3 = 0.731277 loss)
I0708 22:47:30.085372 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.4321 (* 1 = 2.4321 loss)
I0708 22:47:30.085391 99468 sgd_solver.cpp:105] Iteration 49320, lr = 0.001
I0708 22:48:46.651422 99468 solver.cpp:218] Iteration 49360 (0.522441 iter/s, 76.5636s/40 iters), loss = 3.71437
I0708 22:48:46.651736 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.10309 (* 0.3 = 0.630926 loss)
I0708 22:48:46.651793 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.09531 (* 0.3 = 0.628592 loss)
I0708 22:48:46.651808 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.10261 (* 1 = 2.10261 loss)
I0708 22:48:46.651825 99468 sgd_solver.cpp:105] Iteration 49360, lr = 0.001
I0708 22:50:03.277048 99468 solver.cpp:218] Iteration 49400 (0.522121 iter/s, 76.6105s/40 iters), loss = 3.71008
I0708 22:50:03.277305 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.03409 (* 0.3 = 0.610228 loss)
I0708 22:50:03.277333 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.04032 (* 0.3 = 0.612096 loss)
I0708 22:50:03.277349 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.03172 (* 1 = 2.03172 loss)
I0708 22:50:03.277400 99468 sgd_solver.cpp:105] Iteration 49400, lr = 0.001
I0708 22:51:19.879340 99468 solver.cpp:218] Iteration 49440 (0.522196 iter/s, 76.5995s/40 iters), loss = 3.74579
I0708 22:51:19.879617 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.58194 (* 0.3 = 0.774582 loss)
I0708 22:51:19.879662 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.5827 (* 0.3 = 0.774811 loss)
I0708 22:51:19.879678 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.58273 (* 1 = 2.58273 loss)
I0708 22:51:19.879714 99468 sgd_solver.cpp:105] Iteration 49440, lr = 0.001
I0708 22:52:36.484484 99468 solver.cpp:218] Iteration 49480 (0.522177 iter/s, 76.6023s/40 iters), loss = 3.7025
I0708 22:52:36.484724 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.17316 (* 0.3 = 0.651948 loss)
I0708 22:52:36.484776 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.17901 (* 0.3 = 0.653704 loss)
I0708 22:52:36.484791 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.17448 (* 1 = 2.17448 loss)
I0708 22:52:36.484810 99468 sgd_solver.cpp:105] Iteration 49480, lr = 0.001
I0708 22:53:53.104547 99468 solver.cpp:218] Iteration 49520 (0.522075 iter/s, 76.6173s/40 iters), loss = 3.71452
I0708 22:53:53.105298 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.47554 (* 0.3 = 0.742663 loss)
I0708 22:53:53.105357 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.49782 (* 0.3 = 0.749345 loss)
I0708 22:53:53.105373 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.48883 (* 1 = 2.48883 loss)
I0708 22:53:53.105389 99468 sgd_solver.cpp:105] Iteration 49520, lr = 0.001
I0708 22:55:09.700757 99468 solver.cpp:218] Iteration 49560 (0.522241 iter/s, 76.5929s/40 iters), loss = 3.69482
I0708 22:55:09.700987 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.17838 (* 0.3 = 0.653513 loss)
I0708 22:55:09.701007 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.18183 (* 0.3 = 0.654548 loss)
I0708 22:55:09.701022 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.18198 (* 1 = 2.18198 loss)
I0708 22:55:09.701076 99468 sgd_solver.cpp:105] Iteration 49560, lr = 0.001
I0708 22:56:26.341532 99468 solver.cpp:218] Iteration 49600 (0.521934 iter/s, 76.638s/40 iters), loss = 3.77103
I0708 22:56:26.341773 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.3831 (* 0.3 = 0.71493 loss)
I0708 22:56:26.341799 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.3863 (* 0.3 = 0.715891 loss)
I0708 22:56:26.341848 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.37855 (* 1 = 2.37855 loss)
I0708 22:56:26.341866 99468 sgd_solver.cpp:105] Iteration 49600, lr = 0.001
I0708 22:57:42.854746 99468 solver.cpp:218] Iteration 49640 (0.522804 iter/s, 76.5104s/40 iters), loss = 3.70114
I0708 22:57:42.854979 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.40168 (* 0.3 = 0.720505 loss)
I0708 22:57:42.855006 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.39229 (* 0.3 = 0.717686 loss)
I0708 22:57:42.855057 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.38557 (* 1 = 2.38557 loss)
I0708 22:57:42.855073 99468 sgd_solver.cpp:105] Iteration 49640, lr = 0.001
I0708 22:58:59.254925 99468 solver.cpp:218] Iteration 49680 (0.523578 iter/s, 76.3974s/40 iters), loss = 3.71079
I0708 22:58:59.255218 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.21058 (* 0.3 = 0.663174 loss)
I0708 22:58:59.255275 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.20215 (* 0.3 = 0.660644 loss)
I0708 22:58:59.255288 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.20635 (* 1 = 2.20635 loss)
I0708 22:58:59.255307 99468 sgd_solver.cpp:105] Iteration 49680, lr = 0.001
I0708 23:00:15.853015 99468 solver.cpp:218] Iteration 49720 (0.522225 iter/s, 76.5953s/40 iters), loss = 3.71502
I0708 23:00:15.853281 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.07621 (* 0.3 = 0.622863 loss)
I0708 23:00:15.853307 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.07954 (* 0.3 = 0.623863 loss)
I0708 23:00:15.853322 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.07036 (* 1 = 2.07036 loss)
I0708 23:00:15.853374 99468 sgd_solver.cpp:105] Iteration 49720, lr = 0.001
I0708 23:01:32.466379 99468 solver.cpp:218] Iteration 49760 (0.522121 iter/s, 76.6106s/40 iters), loss = 3.65164
I0708 23:01:32.466627 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.39696 (* 0.3 = 0.719087 loss)
I0708 23:01:32.466687 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.39385 (* 0.3 = 0.718154 loss)
I0708 23:01:32.466703 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.39283 (* 1 = 2.39283 loss)
I0708 23:01:32.466722 99468 sgd_solver.cpp:105] Iteration 49760, lr = 0.001
I0708 23:02:48.986902 99468 solver.cpp:218] Iteration 49800 (0.522754 iter/s, 76.5178s/40 iters), loss = 3.66991
I0708 23:02:48.987139 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.75705 (* 0.3 = 0.827115 loss)
I0708 23:02:48.987197 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.77391 (* 0.3 = 0.832172 loss)
I0708 23:02:48.987213 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.75764 (* 1 = 2.75764 loss)
I0708 23:02:48.987232 99468 sgd_solver.cpp:105] Iteration 49800, lr = 0.001
I0708 23:04:05.664381 99468 solver.cpp:218] Iteration 49840 (0.521685 iter/s, 76.6747s/40 iters), loss = 3.68761
I0708 23:04:05.664650 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.27643 (* 0.3 = 0.682929 loss)
I0708 23:04:05.664675 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.26933 (* 0.3 = 0.6808 loss)
I0708 23:04:05.664691 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.28729 (* 1 = 2.28729 loss)
I0708 23:04:05.664744 99468 sgd_solver.cpp:105] Iteration 49840, lr = 0.001
I0708 23:05:22.255897 99468 solver.cpp:218] Iteration 49880 (0.52227 iter/s, 76.5887s/40 iters), loss = 3.70475
I0708 23:05:22.256137 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.23909 (* 0.3 = 0.671728 loss)
I0708 23:05:22.256193 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.23169 (* 0.3 = 0.669507 loss)
I0708 23:05:22.256209 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.22051 (* 1 = 2.22051 loss)
I0708 23:05:22.256227 99468 sgd_solver.cpp:105] Iteration 49880, lr = 0.001
I0708 23:06:38.901861 99468 solver.cpp:218] Iteration 49920 (0.521899 iter/s, 76.6432s/40 iters), loss = 3.74522
I0708 23:06:38.902092 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.34477 (* 0.3 = 0.70343 loss)
I0708 23:06:38.902117 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.3378 (* 0.3 = 0.70134 loss)
I0708 23:06:38.902164 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.34873 (* 1 = 2.34873 loss)
I0708 23:06:38.902181 99468 sgd_solver.cpp:105] Iteration 49920, lr = 0.001
I0708 23:07:55.430269 99468 solver.cpp:218] Iteration 49960 (0.5227 iter/s, 76.5257s/40 iters), loss = 3.69629
I0708 23:07:55.430505 99468 solver.cpp:237] Train net output #0: loss1/loss1 = 2.42696 (* 0.3 = 0.728088 loss)
I0708 23:07:55.430529 99468 solver.cpp:237] Train net output #1: loss2/loss2 = 2.43421 (* 0.3 = 0.730264 loss)
I0708 23:07:55.430546 99468 solver.cpp:237] Train net output #2: loss3/loss3 = 2.43831 (* 1 = 2.43831 loss)
I0708 23:07:55.430569 99468 sgd_solver.cpp:105] Iteration 49960, lr = 0.001

Rotation

Recommend Projects

React

A declarative, efficient, and flexible JavaScript library for building user interfaces.
Vue.js

🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
Typescript

TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
TensorFlow

An Open Source Machine Learning Framework for Everyone
Django

The Web framework for perfectionists with deadlines.
Laravel

A PHP framework for web artisans
D3

Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

javascript

JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
web

Some thing interesting about web. New door for the world.
server

A server is a program made to process requests and deliver data to clients.
Machine learning

Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Visualization

Some thing interesting about visualization, use data art
Game

Some thing interesting about game, make everyone happy.

Recommend Org

Facebook

We are working to build community through open source technology. NB: members must have two-factor auth.
Microsoft

Open source projects and samples from Microsoft.
Google

Google ❤️ Open Source for everyone.
Alibaba

Alibaba Open Source for everyone
D3

Data-Driven Documents codes.
Tencent

China tencent open source team.